基于MRI影像组学的BI-RADS 3-5类乳腺病变三分类
Classification of BI-RADS 3-5 Breast Lesions Based on MRI Radiomics
通讯作者: * Tel: 13761603606, E-mail:yjusst@126.com;# Tel: 13127987382, E-mail:zlwang138136@126.com
第一联系人:
收稿日期: 2022-01-18
基金资助: |
|
Corresponding authors: * Tel: 13761603606, E-mail:yjusst@126.com;# Tel: 13127987382, E-mail:zlwang138136@126.com
Received: 2022-01-18
医生根据磁共振影像征象对患者的乳腺病变程度进行BI-RADS分类评估时存在一定的主观性,且 BI-RADS 3-5类病变的良恶性存在交叉,在临床诊断时极易发生因诊断类别较高而造成不必要的有创治疗.针对这些问题,本文应用影像组学技术对乳腺的T1加权(T1W)和动态对比增强(DCE)磁共振图像进行特征提取和融合,采用最小绝对收缩和选择算子(LASSO)算法筛选出各特征集的最优特征集,并分别使用支持向量机(SVM)、随机森林(RF)、K最近邻(KNN)及逻辑回归(LR)算法进行BI-RADS 3-5类乳腺病变三分类,并且在此基础上实现乳腺良恶性分类.结果显示基于特征融合的四个影像组学模型对乳腺病变BI-RADS 3-5类的分类准确率分别为81.25%、87.50%、78.38%、81.25%;对乳腺病变良恶性鉴别的准确率分别为90.91%、93.55%、92.73%、94.55%. 这表明MRI影像组学结合机器学习的算法对乳腺病变BI-RADS分类效果及良恶性鉴别效果均较好,且特征融合可进一步提高分类预测的准确率.
关键词:
The classification of the breast imaging-reporting and data system (BI-RADS) based on magnetic resonance imaging (MRI) refers to the classification of the degree of lesions according to the image signs of lesions, which is usually subjective. Moreover, the benign and malignant lesions of BI-RADS 3-5 are overlapping, which is prone to unnecessary invasive treatment due to high diagnostic categories in clinical diagnosis. To address these problems, this research applied radiomics for feature extraction and fusion of T1-weighted (T1W) and dynamic contrast-enhanced (DEC) MRI. The least absolute shrinkage and selection operator (LASSO) algorithm was used to screen out the optimal feature collection of each type of MR image. Support vector machine (SVM), random forest (RF), K-nearest neighbour (KNN) and logistic regression (LR) algorithms were applied for BI-RADS 3-5 classification, based on which the benign and malignant lesions were further classified. The results showed that the classification accuracy of breast BI-RADS 3-5 by four radiomics models based on feature fusion was 81.25%, 87.50%, 78.38%, and 81.25%, respectively. Their accuracy in distinguishing the benign and malignant breast lesions was 90.91%, 93.55%, 92.73%, and 94.55%, respectively. This indicates that the combination of radiomics and machine learning correlation algorithm has a good effect on breast MRI BI-RADS classification and benign and malignant differentiation, and feature fusion can further improve the accuracy of classification prediction.
Keywords:
本文引用格式
韩冰, 徐晶, 王远军, 王中领.
HAN Bing.
引言
目前,基于影像组学的肿瘤良恶性病变鉴别及疗效评估是乳腺肿瘤研究的热点[13,14].研究表明,影像组学可从基于T1加权(T1-weighted,T1W)、T2加权(T2-weighted,T2W)、动态对比增强(dynamic contrast-enhanced,DCE)和扩散加权成像(diffusion-weighted imaging,DWI)序列的乳腺磁共振图像中提取形态特征及二阶纹理特征,在保证乳腺癌诊断灵敏度的前提下,提高了乳腺癌诊断的特异度[15⇓-17].近年来,基于多参数MRI的影像组学已被证明可以提高乳腺肿瘤的诊断效能[18⇓⇓⇓-22].Tsarouchi等[21]通过提取DWI和DCE图像的一阶统计量和纹理特征来捕获乳腺病变区域的异质性,并将两种图像的特征进行融合,进一步提高分类模型的乳腺肿瘤良恶性鉴别能力.Zhang等[22]建立了基于207例患者的T2W、扩散峰度成像(diffusion-kurtosis imaging,DKI)、DCE图像的最佳影像组学模型,证实了多序列MRI影像组学技术对乳腺肿瘤的良恶性病变有较高的鉴别能力.Hao等[23]的研究表明对动态T1W和T2W图像的影像组学特征进行融合,能够改善乳腺BI-RADS 4类病变的良恶性评估效能.
以往探讨乳腺病变的研究主要集中于BI-RADS分类已明确条件下乳腺病变的良恶性鉴别效能,而对乳腺病变程度或乳腺病变BI-RADS分类的研究甚少.但在实际情况中,乳腺BI-RADS 3-5类病变中的良恶性可能存在交叉情况.本文基于采用平扫序列和增强序列获得的乳腺磁共振影像数据,建立了不同的影像组学模型,对乳腺病变程度进行了BI-RADS分类,并进一步实现乳腺病变的良恶性分类.
1 实验部分
1.1 被试一般资料
本研究收集了在上海交通大学附属第一人民医院进行平扫和增强扫描的110例女性患者共220幅乳腺磁共振图像,患者年龄范围为24~86岁,平均为51.3岁.影像诊断报告显示BI-RADS 3类患者18例、4类患者42例、5类患者50例,病理报告显示良性病变37例、恶性病变73例.纳入标准:①患者未经化疗等任何治疗措施;②患者MRI影像诊断报告中包含由平扫(T1W)及增强(DCE)序列获得的磁共振图像,且BI-RADS分类在3-5类范围内;③有完整的临床和病理资料.排除标准:①磁共振图像质量差(存在伪影)或清晰度不符合要求;②各序列扫描的磁共振图像不全.本研究获得上海交通大学附属第一人民医院伦理委员会批准.按照7:3比例,将患者分为训练集(n=77)和测试集(n=33).
1.2 MRI扫描
本研究使用的磁共振图像采集自不同的磁共振扫描设备和扫描参数.其中有50例患者(影像诊断报告显示BI-RADS 3类患者13例、4类患者20例、5类患者17例,病理报告显示良性病变30例、恶性病变20例)采用 Philips Ingenia 3.0 T超导型磁共振扫描仪和四通道乳腺专用相控线圈行乳腺磁共振扫描.使用轴向自旋回波(spin echo,SE)序列采集乳腺平扫图像,重复时间(time of repetition,TR)为541.7 ms,回波时间(echo time,TE)为8.0 ms,层厚为3.5 mm,层数为32层,矩阵为480×480;行蒙片扫描确认病灶位置,注射对比剂后采用dyn_eTHRIVE序列行无间隔动态增强扫描,TR为4.2 ms,TE为2.1 ms,层厚为2.0 mm,层数为660层,矩阵为576×576,共扫描6期.其余60例患者(影像诊断报告显示BI-RADS 3类患者5例、4类患者22例、5类患者33例,病理报告显示良性病变7例、恶性病变53例)采用GE 3.0 T(Signa HDxt)磁共振扫描仪,配备八通道乳腺专用相控阵表面线圈.使用轴位快速自旋回波(fast spin echo,FSE)序列采集乳腺平扫图像,TR为420.0 ms,TE为6.9 ms,层厚为5.0 mm,层数为28层,矩阵为512×512;行蒙片扫描确认病灶位置,注射对比剂后使用Ax 3D Vibrant +C序列行无间隔动态增强扫描,TR为4.2 ms,TE为2.1 ms,层厚为1.4 mm,层数为674层,矩阵为512×512,共扫描6期.
1.3 影像组学分析
本文的影像组学分析均使用Python语言(Anaconda平台,
图1
1.3.1 ROI分割及图像预处理
图2
图2
DCE磁共振图像的感兴趣区域(ROI)分割. (a)病灶最大层面勾画ROI示意图;(b)勾画病灶示意图
Fig. 2
Region of interest (ROI) segmentation of DCE magnetic resonance images. (a) Schematic diagram of ROI delineation at the largest layer of the lesion; (b) Schematic diagram of the lesion delineation
1.3.2 特征提取、融合及筛选
分别针对T1W图像及DCE图像的ROI进行基于相同体素的特征提取,从每个乳腺病变中的原始图像和相对应的派生图像中提取影像组学特征共1 743个,其中相对应的派生图像包含对数(logarithm)变换、平方(square)变换、指数(exponential)变换、平方根(square root)变换、梯度(gradient)变换、高斯拉普拉斯算子(Laplacian of Gaussian,LOG)变换和小波(wavelet)变换.根据不同的计算方法将特征类别分为7类,包括形态学特征(shape)、一阶灰度直方图特征(firstorder)、灰度共生矩阵(gray level cooccurrence matrix,GLCM)特征、灰度游程矩阵(gray level run length matrix,GLRLM)特征、灰度相关矩阵(gray level dependence matrix,GLDM)特征、灰度区域大小矩阵(gray level size zone matrix,GLSZM)特征及邻域灰度差矩阵(neighborhood gray tone difference matrix,NGTDM)特征,如表1所示.
表1 乳腺磁共振图像的影像组学特征
Table 1
特征类别 | 特征描述 | 特征数 | 特征输入 |
---|---|---|---|
shape | 表面积、伸长率、平面度、球形度、最大二维直径等 | 14 | 原始图像 |
firstorder | 能量、熵、峰值、最大值、平均值、方差、第10百分位数、第90百分位数等 | 342 | 原始图像、派生图像 |
GLCM | 自相关、联合平均、聚类突出度、聚类阴影、对比、相关、差熵等 | 418 | 原始图像、派生图像 |
GLRLM | 长游程强调、短游程强调、灰度不均匀性、游程百分比、游程方差、游程熵等 | 304 | 原始图像、派生图像 |
GLDM | 小依赖度、大依赖度、依赖不均匀性、依赖方差、依赖熵等 | 266 | 原始图像、派生图像 |
GLSZM | 小区域强调、大区域强调、灰度不均匀性、区域百分比、区域方差、区域熵等 | 304 | 原始图像、派生图像 |
NGTDM | 粗糙度、对比度、繁忙度、复杂度、强度 | 95 | 原始图像、派生图像 |
将T1W图像及DCE图像所提取出来的特征进行融合,形成平扫+增强融合特征集,最终形成平扫特征、增强特征、融合特征三组特征,以期探索融合特征是否能够提升乳腺病变BI-RADS分类及良恶性分类效能. 分别将各特征集进行标准化处理,计算数据的均值与方差.采用LASSO算法进行特征筛选,通过5折交叉验证找出训练集最优的λ值(λ表示L1范数的惩罚力度),根据λ值找到与之对应的不同特征的系数,选择系数不为0的特征,筛选得到与乳腺病变BI-RADS分类和良恶性分类最相关的特征及其相应的系数.
1.3.3 影像组学预测模型的构建、优化及评估
1.3.3.1 乳腺病变BI-RADS 3-5类三分类预测模型
在训练集中,基于特征筛选后得到的平扫特征、增强特征及融合特征的最优特征子集,分别构建四个不同的预测模型:SVM、RF、KNN、LR,其中对SVM及LR模型采用一对多(one-against-all)策略将模型分别进行改进,使其适用于多分类研究,来进行乳腺病变BI-RADS 3-5类的三分类预测.
采用网格搜索及交叉验证结合方法进一步优化各分类器模型参数,利用scikit-learn所提供GridSearchCV类,进行循环遍历,尝试每一种参数组合可能,找到最好的模型estimator.采用5折交叉验证,选择出一组最优参数,使得这组参数下模型效果最好.
计算通过优化后模型得到的各类别的准确率(Accuracy,Acc)及模型的Kappa系数、海明损失来评价各预测模型.
准确率计算公式如下:
其中TP、FP、TN和FN分别表示真阳性、假阳性、真阴性与假阴性.
Kappa系数是在统计学中评估一致性的一种方法,用于检验模型预测结果与实际分类结果是否一致,取值范围在-1~1之间,计算公式如下:
其中
海明损失(HammingLoss)用来衡量预测标签与真实标签的距离,取值在0~1之间.对于给定的样本i,
xor表示异或运算.当预测结果与实际结果完全相符时,距离为0;当预测结果与实际情况完全不符时,距离为1.
由于受试者操作特征(receiver operating characteristic,ROC)曲线只对二分类问题有效,因此本文采用宏平均(macro-average)及微平均(micro-average)的ROC曲线评估影像组学模型的预测能力;并计算其曲线下面积(area under curve,AUC)以评估分类器的性能.在Python 3.8平台采用Delong检验比较基于融合特征的不同分类模型的宏平均及微平均的ROC曲线间的差异,p<0.05认为差异有统计学意义.
1.3.3.2 乳腺病变良恶性二分类预测模型
在训练集中,基于特征筛选后得到的平扫特征、增强特征及融合特征的最优特征子集,分别构建SVM、RF、KNN、LR模型来进行乳腺病变良恶性预测,并仍然采用网格搜索及五折交叉验证相结合方法优化各分类器模型,以提升模型预测性能.
计算优化后模型的准确率、特异度(Specificity,Spec)和灵敏度(Sensitivity,Sen),以评价各预测模型的性能,其中特异度与灵敏度计算公式如下:
通过ROC曲线评估影像组学模型的预测能力;并计算AUC值以评估分类器的性能.在Python 3.8平台采用Delong检验比较基于融合特征的不同分类模型的ROC曲线间的差异,p<0.05认为差异有统计学意义.
2 结果与讨论
2.1 BI-RADS 3-5类乳腺病变三分类结果
2.1.1 最优特征集筛选
表2 经LASSO算法筛选的最优平扫特征及相应系数
Table 2
影像组学特征 | 系数 | 特征详情 |
---|---|---|
联合熵(original_glcm_JointEntropy) | 0.010878 | 度量邻域强度值的可变性 |
平均值(log-sigma-5-0-mm-3D_firstorder_Mean) | 0.120571 | 描述肿瘤区域的平均灰度值 |
小区域低灰度级强调 (wavelet-HLH_glszm_SmallAreaLowGrayLevelEmphasis) | -0.110678 | 描述低灰度小尺寸区域体素的分布 |
归一化相关不均匀性 (wavelet-HHL_gldm_DependenceNonUniformityNormalized) | -0.089366 | 描述GLDM中体素相关关系的相似程度 |
依赖方差(wavelet-HHL_gldm_DependenceVariance) | 0.007990 | 描述GLDM中依赖大小的方差 |
相关性信息测度2(wavelet-HHH_glcm_Imc2) | -0.045300 | 量化纹理的复杂性 |
游程方差(wavelet-HHH_glrlm_RunVariance) | -0.059722 | 度量游程长度的方差 |
依赖熵(gradient_gldm_DependenceEntropy) | 0.019160 | 度量GLDM中依赖大小与灰度级分布的随机性程度 |
小依赖性低灰度级强调(gradient_gldm_SmallDependenceLowGrayLevelEmphasis) | -0.021736 | 描述体素小相关性与低阶灰度值的联合分布情况 |
相关性信息测度1(squareroot_glcm_Imc1) | 0.030811 | 量化纹理的复杂性 |
强度(exponential_ngtdm_Strength) | -0.055385 | 度量肿瘤图像的灰度变化程度 |
表3 经LASSO算法筛选的最优增强特征及相应系数
Table 3
影像组学特征 | 系数 | 特征详情 |
---|---|---|
原始图像最小值(original_firstorder_Minimum) | -0.013973 | 描述肿瘤区域的最小灰度值 |
大依赖高灰度级强调(original_gldm_LargeDependenceHighGrayLevelEmphasis) | 0.039997 | 测量具有较高灰度值和体素强相关关系的联合分布情况 |
偏度(wavelet-LHH_firstorder_Skewness) | 0.001540 | 度量强度平均值的分布不对称性 |
相关性信息测度1(wavelet-LHH_glcm_Imc1) | 0.057154 | 量化纹理的复杂性 |
小波变换LLL方向联合熵 (wavelet-LLL_glcm_JointEntropy) | 0.197864 | 度量邻域强度值的可变性 |
归一化逆差矩(gradient_glcm_Idmn) | 0.034171 | 度量肿瘤图像的局部平均程度 |
平方变换最小值(square_firstorder_Minimum) | 0.037978 | 描述肿瘤区域的最小灰度值 |
平方变换联合熵(square_glcm_JointEntropy) | 0.064132 | 度量邻域强度值的可变性 |
大区域低灰度级强调 (squareroot_glszm_LargeAreaLowGrayLevelEmphasis) | -0.014832 | 测量图像中具有较低灰度值的较大尺寸区域体素的分布 |
低灰度区域强调 (logarithm_glszm_LowGrayLevelZoneEmphasis) | -0.055083 | 描述低灰度级区域体素的分布 |
低灰度强调(logarithm_gldm_LowGrayLevelEmphasis) | -0.084834 | 描述低阶灰度体素的分布情况 |
表4 经LASSO算法筛选的最优融合特征及相应系数
Table 4
影像组学特征 | 系数 | 特征详情 |
---|---|---|
最大2D直径(列) (original_shape_Maximum2DDiameterColumn) | 0.081848 | 冠状平面中肿瘤表面网格顶点之间最大的欧几里得距离 |
相关性信息测度1(wavelet-LHL_glcm_Imc1) | 0.018552 | 量化纹理的复杂性 |
集群阴影(wavelet-LHH_glcm_ClusterShade) | -0.022909 | 描述图像的褶皱程度 |
小波变换HLL方向粗糙度 (wavelet-HLL_ngtdm_Coarseness) | -0.051320 | 度量中心体素与其邻域体素之间平均差异 |
小区域低灰度级强调 (wavelet-HLH_glszm_SmallAreaLowGrayLevelEmphasis) | -0.031217 | 描述图像中具有较低灰度值的较小尺寸区域体素分布 |
相关性信息测度2(wavelet-HHL_glcm_Imc2) | -0.066184 | 量化纹理的复杂性 |
逆方差(wavelet-HHH_glcm_InverseVariance) | 0.010646 | 度量肿瘤图像局部均匀程度 |
归一化灰度不均匀度 (wavelet-LLL_glszm_GrayLevelNonUniformityNormalized) | -0.138090 | 测量图像中灰度强度值的可变性 |
小波变换LLL方向粗糙度 (wavelet-LLL_ngtdm_Coarseness) | -0.086469 | 度量中心体素与其邻域体素之间平均差异 |
归一化区域大小不均匀度 (square_glszm_SizeZoneNonUniformityNormalized) | -0.022937 | 测量整个图像中大小区域体积的可变性 |
最小值(exponential_firstorder_Minimum) | -0.038634 | 描述肿瘤区域的最小灰度值 |
对比度(logarithm_ngtdm_Contrast) | -0.019143 | 度量体素灰度的空间变化率 |
图3
图3
采用LASSO算法分别筛选最优平扫特征、增强特征和融合特征. (a)通过调整λ使模型均方误差(MSE)达到最小,以确定最佳λ;(b)最优特征系数收敛图
Fig. 3
The LASSO algorithm is used to screen the optimal T1W features, DCE features and fusion features, respectively. (a) The optimal λ is determined by adjusting λ to minimize the mean square error (MSE) of the model; (b) Convergence diagram of optimal characteristic coefficients
2.1.2 各模型的诊断效能及模型评估
基于最优平扫特征、增强特征及融合特征的四个影像组学模型的ROC曲线如图4所示,12个图中分别包含各模型的Micro-average及Macro-average两种计算策略的ROC曲线及BI-RADS 3类、4类及5类的ROC曲线.可以看出,各分类模型的Micro-average及Macro-average两种计算策略的AUC值存在一定差异,这可能是因为Micro-average方法是将多分类的结果转化为二分类情况,然后进行典型的二分类ROC曲线分析,而Macro-average方法是将每一类做ROC曲线分析,然后取平均得到最终的ROC曲线,二者差异稳定低于0.10.且在融合特征中,各模型的Micro-average及Macro-average两种平均方式的AUC稳定在0.85以上,均具有较高的分类效能,且普遍高于单一特征(除个别例外情况).由图4还可以看出各最优特征集中BI-RADS 4类的AUC普遍低于BI-RADS 3类及5类,分析原因可能在于乳腺BI-RADS 4类所含恶性概率为2%~95%,病变程度跨度远大于BI-RADS 3类(恶性概率≤2%)及5类(恶性概率≥95%),导致BI-RADS 4类的AUC低于BI-RADS 3类及5类.
图4
图4
基于不同特征的四种模型的ROC曲线(FPR:1-特异度,TPR:灵敏度)
Fig. 4
ROC curves of four models based on different features (FPR: False positive rate, TPR: True positive rate)
表5给出了基于各种特征的SVM、RF、KNN、LR模型的分类性能的评估参数.从表5可以看出,基于最优增强特征的各模型鉴别乳腺BI-RADS 3-5类的准确率优于平扫特征;特征融合后的准确率也进一步提高,BI-RADS 3-5类分类准确率在特征融合的模型中最高已达到87.50%,且Kappa系数及海明损失也有所优化,表明特征融合可进一步提升BI-RADS分类的效能.本研究获得的最高准确率高于Domingues等[26]利用基于AlexNet架构的预训练卷积神经网络在乳腺钼靶中进行BI-RADS分类的准确率(83.4%),以及Siddeeq等[27]等利用乳腺钼靶数据基于RN-BCNN进行BI-RADS分类的准确率(85.9%),分析原因在于本研究通过对乳腺磁共振图像进行BI-RADS分类,所提取的影像组学特征是基于三维磁共振图像,较于钼靶二维图像能更为全面度量病灶的空间分布信息等客观信息,使得模型准确率达到了较高的水平.在基于融合特征的各分类模型中,RF模型表现最优,且SVM模型与LR模型准确率均在80.00%以上,表明基于影像组学特征的机器学习模型均具有较高的分类效能,能够在临床诊断中为医生提供客观的分类参考,辅助医生做出更加准确客观的病变程度诊断.
表5 基于各种特征的不同模型对乳腺病变BI-RADS 3-5类的诊断效能
Table 5
特征 | 模型 | 准确率 | Kappa系数 | 海明损失 | Micro AUC | Macro AUC |
---|---|---|---|---|---|---|
平扫特征 | SVM | 64.86% | 0.419 | 0.297 | 0.848 | 0.820 |
RF | 70.27% | 0.421 | 0.333 | 0.878 | 0.846 | |
KNN | 70.27% | 0.421 | 0.333 | 0.830 | 0.769 | |
LR | 71.43% | 0.421 | 0.333 | 0.858 | 0.882 | |
增强特征 | SVM | 70.27% | 0.428 | 0.297 | 0.895 | 0.847 |
RF | 86.49% | 0.428 | 0.297 | 0.928 | 0.862 | |
KNN | 76.19% | 0.445 | 0.297 | 0.875 | 0.828 | |
LR | 78.57% | 0.428 | 0.297 | 0.948 | 0.929 | |
融合特征 | SVM | 81.25% | 0.606 | 0.224 | 0.881 | 0.855 |
RF | 87.50% | 0.676 | 0.188 | 0.951 | 0.988 | |
KNN | 78.38% | 0.606 | 0.224 | 0.886 | 0.867 | |
LR | 81.25% | 0.606 | 0.224 | 0.961 | 0.989 |
2.2 乳腺病变良恶性分类预测
2.2.1 最优特征集筛选
表6 经LASSO算法筛选的最优平扫特征及相应系数
Table 6
影像组学特征 | 系数 | 特征详情 |
---|---|---|
联合能量(original_glcm_JointEnergy) | -0.074162 | 度量图像纹理中相邻灰度变换稳定程度 |
最大概率(original_glcm_MaximumProbability) | -0.049634 | 描述图像中出现次数最多的纹理特征 |
大依赖低灰度级强调(log-sigma-2-0-mm-3D_gldm_LargeDependenceLowGrayLevelEmphasis) | -0.029816 | 描述体素强相关关系与低阶灰度的联合分布情况 |
大区域低灰度级强调 (wavelet-LLH_glszm_LargeAreaLowGrayLevelEmphasis) | 0.001242 | 描述低灰度大尺寸区域体素的分布 |
小依赖低灰度级强调 (wavelet-HHL_gldm_SmallDependenceLowGrayLevelEmphasis) | -0.008748 | 描述体素小相关关系与低阶灰度的联合分布情况 |
小波变换HHL方向归一化区域大小不均匀度 (wavelet-HHL_glszm_SizeZoneNonUniformityNormalized) | -0.020799 | 测量整个图像中大小区域体积的可变性 |
强度(wavelet-HHL_ngtdm_Strength) | -0.083993 | 度量肿瘤图像的灰度变化程度 |
短游程低灰度级强调(square_glrlm_ShortRunLowGrayLevelEmphasis) | -0.088759 | 度量低阶灰度值与短游程长度的联合分布情况 |
小区域低灰度级强调(exponential_glszm_SmallAreaLowGrayLevelEmphasis) | 0.037705 | 描述低灰度小尺寸区域体素的分布 |
对数变换归一化区域大小不均匀度(logarithm_glszm_SizeZoneNonUniformityNormalized) | -0.004205 | 测量整个图像中大小区域体积的可变性 |
小依赖强调(logarithm_gldm_SmallDependenceEmphasis) | -0.011085 | 描述与领域内体素相关性较小的体素分布情况 |
表7 经LASSO算法筛选的最优增强特征及相应系数
Table 7
影像组学特征 | 系数 | 特征详情 |
---|---|---|
长轴长度(original_shape_MajorAxisLength) | 0.053568 | 度量肿瘤最长轴的长度 |
小区域强调(wavelet-LLH_glszm_SmallAreaEmphasis) | 0.007506 | 度量小尺寸区域的分布情况 |
大依赖低灰度级强调 (wavelet-LLH_gldm_LargeDependenceLowGrayLevelEmphasis) | -0.022168 | 描述体素强相关关系与低阶灰度的联合分布情况 |
强度(wavelet-LHL_ngtdm_Strength) | -0.002489 | 度量肿瘤图像的灰度变化程度 |
峰度(wavelet-LHH_firstorder_Kurtosis) | -0.038882 | 度量图像ROI中值分布的峰值 |
小依赖低灰度级强调 (wavelet-HLL_gldm_SmallDependenceLowGrayLevelEmphasis) | -0.003671 | 描述体素小相关关系与低阶灰度的联合分布情况 |
归一化灰度不均匀度 (wavelet-HLH_glszm_GrayLevelNonUniformityNormalized) | -0.117303 | 测量图像中灰度强度值的可变性 |
梯度变换联合熵(gradient_glcm_JointEntropy) | 0.001880 | 度量邻域强度值的可变性 |
平方变换联合熵(square_glcm_JointEntropy) | 0.058258 | 度量邻域强度值的可变性 |
强度(square_ngtdm_Strength) | -0.046019 | 度量肿瘤图像的灰度变化程度 |
归一化依赖不均匀性(exponential_gldm_DependenceNonUniformityNormalized) | -0.071656 | 测量整个图像中体素相关关系的相似程度 |
表8 经LASSO算法筛选的最优融合特征及相应系数
Table 8
影像组学特征 | 系数 | 特征详情 |
---|---|---|
长轴长度(original_shape_MajorAxisLength) | 0.050888 | 度量肿瘤最长轴的长度 |
联合能量(original_glcm_JointEnergy) | -0.016239 | 度量图像纹理中相邻灰度变换稳定程度 |
最大概率(original_glcm_MaximumProbability) | -0.071362 | 描述图像中出现次数最多的纹理特征 |
小波变换LLH方向-小区域强调 (wavelet-LLH_glszm_SmallAreaEmphasis) | 0.009840 | 度量小尺寸区域的分布情况 |
大依赖低灰度级强调 (wavelet-LLH_gldm_LargeDependenceLowGrayLevelEmphasis) | -0.014709 | 描述体素强相关关系与低阶灰度的联合分布情况 |
低灰度区域强调 (wavelet-LHH_glszm_LowGrayLevelZoneEmphasis) | -0.002699 | 描述低灰度级区域体素的分布 |
区域熵(wavelet-LHH_glszm_ZoneEntropy) | 0.090181 | 度量灰度区域大小与灰度级分布的不稳定性 |
相关性信息测度2(wavelet-HHL_glcm_Imc2) | -0.086920 | 量化纹理的复杂性 |
小波变换HHL方向-小区域强调 (wavelet-HHL_glszm_SmallAreaEmphasis) | -0.051711 | 度量小区域尺寸的分布情况 |
小依赖低灰度级强调 (wavelet-HHL_gldm_SmallDependenceLowGrayLevelEmphasis) | -0.012360 | 描述体素小相关关系与低阶灰度的联合分布情况 |
中位数(wavelet-HHH_firstorder_Median) | -0.023237 | 描述肿瘤区域的灰度中位数 |
逆方差(wavelet-HHH_glcm_InverseVariance) | 0.013141 | 度量肿瘤图像局部均匀程度 |
粗糙度(wavelet-LLL_ngtdm_Coarseness) | -0.014267 | 度量中心体素与其邻域体素灰度值的平均差异 |
短游程低灰度级强调(square_glrlm_ShortRunLowGrayLevelEmphasis) | -0.048257 | 度量低阶灰度值与短游程长度的联合分布情况 |
强度(square_ngtdm_Strength) | -0.002079 | 度量肿瘤图像的灰度变化程度 |
第10%分位值(squareroot_firstorder_10Percentile) | -0.003926 | 指肿瘤区域10%分位数的灰度值 |
小区域低灰度级强调(exponential_glszm_SmallAreaLowGrayLevelEmphasis) | 0.003075 | 描述低灰度小尺寸区域体素的分布 |
小依赖强调(logarithm_gldm_SmallDependenceEmphasis) | -0.002973 | 描述与领域内体素相关性较小的体素分布情况 |
图5
图5
采用LASSO算法分别筛选最优平扫特征、增强特征和融合特征. (a)通过调整λ使模型均方误差(MSE)达到最小,以确定最佳λ;(b)最优特征系数收敛图
Fig. 5
The LASSO algorithm is used to screen the optimal T1W features, DCE features and fusion features, respectively. (a) The optimal λ is determined by adjusting λ to minimize the mean square error (MSE) of the model; (b) Convergence diagram of optimal characteristic coefficients
2.2.2 各模型的诊断性能及模型评估
基于各最优特征的四个影像组学模型的ROC曲线如图6所示,在三组特征中,各模型的AUC值趋于稳定,其中基于融合特征的各模型的AUC值已达到0.95以上,表明经LASSO算法选择后的影像组学特征在四个模型中均表现良好.表9给出了基于各种特征的不同模型的诊断性能,从表9可以看出,基于最优平扫特征的各分类模型的准确率均低于85.00%,而基于增强特征的各分类模型的准确率均高于85.00%,表明基于增强序列的影像组学特征鉴别乳腺病变良恶性的效能优于平扫序列;特征融合后,各分类模型准确率均高于90.00%,具有较高的诊断效能,且LR模型的准确率已达到94.55%,表现出最佳的诊断效能,表明特征融合的诊断效能优于其他单一特征,特征融合可进一步提升乳腺病变良恶性鉴别效能.
图6
图6
基于不同特征的四种模型的ROC曲线
Fig. 6
ROC curves of four models based on different features
表9 基于各种特征的不同模型对乳腺病变良恶性的诊断效能
Table 9
特征 | 模型 | AUC | 准确率 | 灵敏度 | 特异度 |
---|---|---|---|---|---|
平扫特征 | SVM | 0.889 | 80.65% | 66.67% | 86.67% |
RF | 0.934 | 83.87% | 66.67% | 90.91% | |
KNN | 0.838 | 80.65% | 77.78% | 81.82% | |
LR | 0.955 | 83.87% | 77.78% | 86.36% | |
增强特征 | SVM | 0.927 | 85.45% | 92.31% | 83.33% |
RF | 0.960 | 89.09% | 84.62% | 90.48% | |
KNN | 0.958 | 85.45% | 84.62% | 85.71% | |
LR | 0.965 | 89.09% | 84.62% | 90.48% | |
融合特征 | SVM | 0.973 | 90.91% | 78.57% | 95.19% |
RF | 0.958 | 93.55% | 90.00% | 95.24% | |
KNN | 0.971 | 92.73% | 92.86% | 92.68% | |
LR | 0.974 | 94.55% | 85.71% | 97.56% |
本研究中基于T1W、DCE图像的融合特征的良恶性分类模型AUC值最高达到了0.974(LR模型),高于Zhang等[22]利用基于T2W、DKI图像及定量药代动力学参数特征融合的SVM分类模型预测良恶性的AUC值(0.921),以及Hao等[23]针对BI-RADS 4类病变将动态T1W序列与T2W图像特征融合的SVM分类模型预测良恶性的AUC值(0.77),其原因首要在于本研究使用了多个模型进行比较,并对每个模型进行详细的调参优化;其次,本研究是在乳腺病变BI-RADS 3-5类范围内进行良恶性分类研究,不局限于 BI-RADS 4类良恶性跨度较大的单类别中,使得良恶性分类研究范围更广,从而使模型的总体准确率及AUC值达到了较高的水平.
2.3 讨论
在本研究中,通过LASSO算法筛选出来的特征以纹理特征为主,在乳腺病变BI-RADS类别分类研究中以GLCM和GLDM特征表现突出,在乳腺良恶性病变分类研究中以GLSZM特征为主.有研究[28]表明,基于不同矩阵的纹理特征能够反映不同的灰度空间相关特性或体素强度的空间分布,进一步反映出肿瘤微环境的异质性与复杂性,其中基于不同矩阵的熵值越大,表明病变在细微结构排列上区别越大,图像异质性越强;而本研究也发现,在乳腺病变分类研究中,联合熵、依赖熵、区域熵均较大,表明乳腺病灶的异质性较大,有助于预测乳腺病变的分类.此外,从T1W图像的最优特征与DCE图像最优特征所进行建模得到的分类效能(表5、表9)来看,DCE图像可能较T1W图像更利于提供肿瘤微观信息,显示病灶异质性.综合而言,虽然这些特征难以被肉眼所识别,但却能通过影像组学被充分利用,为乳腺病变诊断和预测提供客观的信息.
在乳腺病变BI-RADS分类研究中,基于最优融合特征,SVM、RF、KNN和LR的Micro AUC依次为0.881、0.951、0.886和0.961,Macro AUC依次为0.855、0.988、0.867和0.989(图4),DeLong检验显示在Macro AUC中,RF与SVM(p=0.037)、KNN(p=0.039)的ROC曲线之间具有统计学意义,而与LR曲线之间没有表现出来统计学上显著的性能差异(p=0.481),表明在乳腺病变BI-RADS分类研究中,RF模型与LR模型的分类性能较好,而从表5可以看出RF模型的分类准确率、Kappa系数和海明损失较于其他模型表现更优.因此综合而言,RF模型表现性能最优.在乳腺病变良恶性分类研究中,基于最优融合特征,SVM、RF、KNN和LR的AUC依次为0.973、0.958、0.971和0.974(图6),Delong检验显示LR仅相对于RF有统计学意义上的更高性能(p=0.034),而与KNN(p=0.078)、SVM(p=0.067)之间没有统计学意义上的差异,且与表9中所得到的LR模型具有最佳的分类诊断性能一致.综合而言,LR模型表现性能最优.表10给出了基于融合特征的各分类模型两两之间的Delong检验结果.
表10 基于不同模型诊断效能的Delong检验的p值
Table 10
AUC | RF与SVM | RF与KNN | RF与LR | LR与SVM | LR与KNN | SVM与KNN | |
---|---|---|---|---|---|---|---|
BI-RADS分类 | Micro AUC | 0.041 | 0.058 | 0.134 | 0.069 | 0.071 | 0.317 |
Macro AUC | 0.037 | 0.039 | 0.481 | 0.037 | 0.039 | 0.093 | |
良恶性分类 | AUC | 0.052 | 0.067 | 0.034 | 0.067 | 0.078 | 0.078 |
3 结论
本文基于影像组学技术,使用多个机器学习分类模型实现了对乳腺病变的BI-RADS分类及良恶性分类.首先分别提取乳腺的平扫与增强序列的磁共振影像特征,并将两序列的特征进行融合,得到平扫特征、增强特征和融合特征三组特征,然后采用参数优化后的SVM、RF、KNN、LR四种分类算法分别对经LASSO算法筛选的三种最优特征进行建模.结果显示基于融合特征的各分类算法表现最好:在乳腺病变BI-RADS 3-5类三分类中,各模型的准确率分别为81.25%、87.50%、78.38%、81.25%,且各模型AUC值均稳定在0.850以上,其中RF模型性能最优;在乳腺病变良恶性分类中,各模型准确率分别为90.91%、93.55%、92.73%、94.55%,且各模型AUC值均稳定在0.950以上,其中LR模型性能最优.研究表明了基于多序列的MRI影像组学特征结合机器学习的策略在鉴别乳腺良恶性病变及BI-RADS分类方面均具有较高的诊断价值,能够在临床诊断中为医生提供客观的参考;且经LASSO算法筛选后的纹理特征能够为疾病诊断和预测提供可靠的信息,进一步辅助医生做出更加准确的病变分类诊断;多序列磁共振图像特征融合也能进一步提升乳腺病变的诊断效能.在接下来的研究中,我们将考虑扩大多中心的样本量,并结合深度学习相关算法,进一步提高分类准确率,以期更好地辅助医生进行临床诊断.
利益冲突
无
参考文献
Cancer statistics, 2021
[J]. ,DOI:10.3322/caac.21654 URL [本文引用: 1]
Current cancer situation in China: good or bad news from the 2018 global cancer statistics?
[J]. ,DOI:10.1186/s40880-019-0368-6 URL [本文引用: 1]
Rapid review: radiomics and breast cancer
[J]. ,DOI:10.1007/s10549-018-4675-4 URL [本文引用: 1]
Breast MRI: State of the art
[J]. ,DOI:10.1148/radiol.2019182947 PMID:31361209 [本文引用: 1]
MRI of the breast has the highest sensitivity for breast cancer detection among current clinical imaging modalities and is indispensable for breast imaging practice. While the basis of breast MRI consists of T1-weighted contrast-enhanced imaging, T2-weighted, ultrafast, and diffusion-weighted imaging may be used to improve lesion characterization. Such multiparametric assessment of breast lesions allows for excellent discrimination between benign and malignant breast lesions. Indications for breast MRI are expanding. In preoperative staging, multiple studies confirm the superiority of MRI to other imaging modalities for tumor size estimation and detection of additional tumor foci in the ipsilateral and contralateral breast. Ongoing studies show that in experienced hands this can be used to improve breast cancer surgery, although there is no evidence of improved long-term outcomes. Screening indications are likewise growing as evidence is accumulating that OncologicRI depicts cancers at an earlier stage than mammography in all women. To manage the associated costs for screening, the use of abbreviated protocols may be beneficial. In patients treated with neoadjuvant chemotherapy, MRI is used to document response. It is essential to realize that oncologic and surgical response are different, and evaluation should be adapted to the underlying question.© RSNA, 2019.
Quantitative predictors of response to neoadjuvant chemotherapy on dynamic contrast-enhanced 3T breast MRI
[J]. ,DOI:10.1093/jbi/wbab095 URL [本文引用: 1]
Advances in breast imaging with current screening recommendations and controversies
[J]. ,DOI:10.1016/j.ogc.2021.11.001 URL [本文引用: 1]
Classification and localization of meningioma and acoustic neuroma in cerebellopontine angle based on mask RCNN
[J]. ,
基于Mask RCNN的桥小脑角区脑膜瘤与听神经瘤分类定位研究
[J]. ,
Biomarkers and imaging of breast cancer
[J]. ,DOI:10.2214/AJR.17.18708 URL [本文引用: 1]
Breast lesion shape and margin evaluation: BI-RADS based metrics understate radiologists' actual levels of agreement
[J]. ,DOI:10.1016/j.compbiomed.2018.04.005 URL [本文引用: 1]
Radiomics in breast MRI: current progress toward clinical application in the era of artificial intelligence
[J].DOI:10.1007/s11547-021-01423-y URL [本文引用: 1]
Imaging and the completion of the omics paradigm in breast cancer
[J]. ,DOI:10.1007/s00117-018-0409-1 URL [本文引用: 1]
Prediction of preoperative T staging of rectal cancer based on radiomics
[J]. ,
基于影像组学的直肠癌术前T分期预测
[J]. ,
Does texture analysis of MR images of breast tumors help predict response to treatment?
[J]. ,DOI:10.1148/radiol.2017172454 PMID:29356631 [本文引用: 1]
MRI radiogenomics for intelligent diagnosis of breast tumors and accurate prediction of neoadjuvant chemotherapy responses — A review
[J]. ,DOI:10.1016/j.cmpb.2021.106510 URL [本文引用: 1]
Radiomics and machine learning with multiparametric breast MRI for improved diagnostic accuracy in breast cancer diagnosis
[J]. ,DOI:10.3390/diagnostics11060919 URL [本文引用: 1]
Effectivity of combined diffusion-weighted imaging and contrast-enhanced MRI in malignant and benign breast lesions
[J]. ,
Radiomics methodology for breast cancer diagnosis using multiparametric magnetic resonance imaging
[J]. ,
The application of radiomics in breast MRI: A review
[J]. ,
Multiparametric radiomics methods for breast cancer tissue characterization using radiological imaging
[J]. ,DOI:10.1007/s10549-020-05533-5 PMID:32020435 [本文引用: 1]
Multiparametric radiological imaging is vital for detection, characterization, and diagnosis of many different diseases. Radiomics provide quantitative metrics from radiological imaging that may infer potential biological meaning of the underlying tissue. However, current methods are limited to regions of interest extracted from a single imaging parameter or modality, which limits the amount of information available within the data. This limitation can directly affect the integration and applicable scope of radiomics into different clinical settings, since single image radiomics are not capable of capturing the true underlying tissue characteristics in the multiparametric radiological imaging space. To that end, we developed a multiparametric imaging radiomic (mpRad) framework for extraction of first and second order radiomic features from multiparametric radiological datasets.We developed five different radiomic techniques that extract different aspects of the inter-voxel and inter-parametric relationships within the high-dimensional multiparametric magnetic resonance imaging breast datasets. Our patient cohort consisted of 138 breast patients, where, 97 patients had malignant lesions and 41 patients had benign lesions. Sensitivity, specificity, receiver operating characteristic (ROC) and areas under the curve (AUC) analysis were performed to assess diagnostic performance of the mpRad parameters. Statistical significance was set at p < 0.05.The mpRad features successfully classified malignant from benign breast lesions with excellent sensitivity and specificity of 82.5% and 80.5%, respectively, with Area Under the receiver operating characteristic Curve (AUC) of 0.87 (0.81-0.93). mpRad provided a 9-28% increase in AUC metrics over single radiomic parameters.We have introduced the mpRad framework that extends radiomic analysis from single images to multiparametric datasets for better characterization of the underlying tissue biology.
A rapid volume of interest-based approach of radiomics analysis of breast MRI for tumor decoding and phenotyping of breast cancer
[J]. ,
Multi-parametric MRI lesion heterogeneity biomarkers for breast cancer diagnosis
[J]. ,DOI:10.1016/j.ejmp.2020.10.007 URL [本文引用: 2]
Radiomics based on multimodal MRI for the differential diagnosis of benign and malignant breast lesions
[J]. ,DOI:10.1002/jmri.27098 PMID:32061014 [本文引用: 3]
MRI-based radiomics has been used to diagnose breast lesions; however, little research combining quantitative pharmacokinetic parameters of dynamic contrast-enhanced MRI (DCE-MRI) and diffusion kurtosis imaging (DKI) exists.To develop and validate a multimodal MRI-based radiomics model for the differential diagnosis of benign and malignant breast lesions and analyze the discriminative abilities of different MR sequences.Retrospective.In all, 207 female patients with 207 histopathology-confirmed breast lesions (95 benign and 112 malignant) were included in the study. Then 159 patients were assigned to the training group, and 48 patients comprised the validation group.T -weighted (T W), T -weighted (T W), diffusion-weighted MR imaging (b-values = 0, 500, 800, and 2000 seconds/mm ) and quantitative DCE-MRI were performed on a 3.0T MR scanner.Radiomics features were extracted from T WI, T WI, DKI, apparent diffusion coefficient (ADC) maps, and DCE pharmacokinetic parameter maps in the training set. Models based on each sequence or combinations of sequences were built using a support vector machine (SVM) classifier and used to differentiate benign and malignant breast lesions in the validation set.Optimal feature selection was performed by Spearman's rank correlation coefficients and the least absolute shrinkage and selection operator algorithm (LASSO). Receiver operating characteristic (ROC) curves were used to assess the diagnostic performance of the radiomics models in the validation set.The area under the ROC curve (AUC) of the optimal radiomics model, including T WI, DKI, and quantitative DCE-MRI parameter maps was 0.921, with an accuracy of 0.833. The AUCs of the models based on T WI, T WI, ADC map, DKI, and DCE pharmacokinetic parameter maps were 0.730, 0.791, 0.770, 0.788, and 0.836, respectively.The model based on radiomics features from T WI, DKI, and quantitative DCE pharmacokinetic parameter maps has a high discriminatory ability for benign and malignant breast lesions.3 TECHNICAL EFFICACY STAGE: 2 J. Magn. Reson. Imaging 2020;52:596-607.© 2020 International Society for Magnetic Resonance in Medicine.
Application of MRI radiomics-based machine learning model to improve contralateral BI-RADS 4 lesion assessment
[J]. ,
Breast DCE-MRI radiomics: a robust computer-aided system based on reproducible BI-RADS features across the influence of datasets bias and segmentation methods
[J]. ,
A deep look into radiomics
[J]. ,DOI:10.1007/s11547-021-01389-x URL [本文引用: 1]
Bi-Rads classification of breast cancer: A new pre-processing pipeline for deep models training
[C]// ,
Deep learning RN-BCNN model for breast cancer BI-RADS classification
[C]. .
/
〈 | 〉 |