Research on Transformer Super-Resolution Reconstruction Algorithm for Ultrafast Spatiotemporal Encoding Magnetic Resonance Imaging
Corresponding authors: * Tel: 027-87199686, E-mail:qingjia.bao@apm.ac.cn;# Tel: 027-87198790, E-mail:chyliu@apm.ac.cn.
Received: 2024-04-16 Online: 2024-05-16
时空编码(SPEN)磁共振成像(MRI)是一种超快MRI技术,通过该技术采集获得的原始图像空间分辨率较低,需要基于序列物理原理进行超分辨率重建以提高其原始图像的分辨率,而现有的基于深度学习SPEN超分辨率重建算法在提取图像像素长距离依赖关系上的能力有限.为了解决此问题,本文提出了一种基于Transformer的SPEN MRI超分辨率重建算法.该算法采用编码器-解码器结构,并引入Transformer模块以提取特征图的局部上下文信息和长距离依赖关系.实验结果表明,本文所提的重建算法可以在不增加额外采样点的情况下从SPEN低分辨率图像中重建出高空间分辨率、无混叠伪影的超分辨率图像.与现有的超分辨率算法相比,本文提出的算法在临床前以及临床数据集上都取得了更好的重建效果.
Spatio-temporal encoding (SPEN) magnetic resonance imaging (MRI) is an ultrafast MRI technique. However, resolution of the original image acquired with SPEN is relatively low, requiring super-resolution reconstruction based on sequence physics principles to improve spatial resolution. As the existing SPEN super-resolution reconstruction algorithms based on deep learning have confined abilities to capture long-range dependencies, this paper proposes a transformer-based SPEN MRI super-resolution reconstruction algorithm. An encoder-decoder structure is adopted, and a transformer module is introduced to extract local context information and long-range dependencies of feature maps. Experimental results show that the proposed reconstruction method can reconstruct a super-resolution image with high spatial resolution and no aliasing artifacts from the low-resolution SPEN image without adding additional sampling points. Compared to the existing super-resolution methods, the proposed method achieves better results on both clinical and preclinical datasets.
宁欣宙, 黄臻, 陈西曲, 刘鑫杰, 陈罡, 张志, 鲍庆嘉, 刘朝阳.
NING Xinzhou, HUANG Zhen, CHEN Xiqu, LIU Xinjie, CHEN Gang, ZHANG Zhi, BAO Qingjia, LIU Chaoyang.
磁共振成像(Magnetic Resonance Imaging,MRI)是一种卓越的非侵入性医学成像技术,可无损地获得生物体内不同对比度结构图像以及各种丰富的功能信息,如扩散、脑功能、代谢等,其在生物、医学等领域发挥着重要作用[1,2].超快MRI扫描技术能大幅缩短常规多次激发MRI方法的扫描时间,将几分钟缩短至毫秒量级.该技术不仅大幅提高了检测效率[3],而且由于其在毫秒级别尺度内生物体的宏观运动可以忽略不计,因此被广泛地应用于磁共振功能成像[4]、实时动态成像[5]和扩散张量成像[6]等领域.回波平面成像(Echo Planar Imaging,EPI)是最常见的超快MRI序列之一,该序列在单次射频脉冲激发后使用快速梯度切换以获取单个脉冲激发周期内的所有k空间编码信息,从而大大提升了其采样速度[7].由于EPI序列沿相位编码方向的带宽相对较低,使其对静磁场不均匀性较为敏感,因此EPI图像往往存在磁化率伪影或化学位移伪影[8],从而限制了其在高场磁共振系统上的进一步应用.值得注意的是,现有成熟的商用临床磁共振仪器可以利用并行成像技术缩短采样时间,从而在一定程度上克服磁场不均匀性的影响,然而在高场及超高场成像仪中,磁化率伪影仍是限制EPI的一个重要因素,而且在临床小动物实验中,由于磁体空间等限制,往往不能采用多通道的数据采集,因此如何实现无磁化率伪影的超快磁共振数据采集仍是磁共振领域的一个重要研究方向.
为克服EPI序列的磁化率及化学位移伪影问题,以色列威兹曼研究所的Lucio Frydman小组提出了一种新的超快磁共振序列:时空编码(Spatiotemporal Encoded,SPEN)MRI[9].该序列通过在相位编码维度引入线性扫频(Chirp)脉冲,并在梯度场的辅助下实现不同时刻对于不同位置上自旋的激发或重聚,从而实现对自旋的二次相位编码.在采样期间,SPEN通过梯度场作用不断实现二次相位顶点的移动,以实现整体空间自旋的解码[10].由于SPEN采用了与EPI相同的回波链数据采集方式,因此同样可以实现毫秒级的超快MRI,并且由于采用二次相位的空间编码方式,SPEN可以有效地提高相位编码维度的带宽,从而更好地抵抗场不均匀性及化学位移的影响[11].得益于二次相位编码的空间选择性,直接对SPEN采样信号进行求模操作,即可获得空间中不同位置的自旋密度(MRI图像).然而与EPI图像相比,直接求模值的SPEN图像空间分辨率较低.理论研究表明,在同等的采样情况下,SPEN模值图像的分辨率较EPI的结果下降了
SPEN的超分辨率重建算法与常规的图像超分辨率重建算法有所不同.SPEN的物理原理决定其超分辨率重建算法可以利用SPEN二次项相位顶点之间的冗余性来提高图像的空间分辨率[13].近年来,研究人员提出了多种SPEN超分辨率重建算法,如部分傅里叶法[14]和去卷积算法[15]等.部分傅里叶法利用SPEN采样信号的空间选择特性,仅考虑稳定相位点附近的采样信号,通过加权相位信息矩阵重建出超分辨率图像,该算法不需要进行迭代求解,因此重建速度较快.去卷积算法是一种灵活的超分辨率重建算法,该算法利用卷积性质,将空间编码采样信号转化为矩阵卷积的形式,进而利用反卷积算法重建出超分辨率图像,与原本的采样信号相比,矩阵卷积简化了SPEN采样信号的二次相位,使得采样信号更加平滑.同时,对平滑信号使用线性插值进行拟合扩充,提高了重建图像的数字分辨率.上述两种算法不需要迭代,可以快速重建出SPEN超分辨率图像,然而这两种算法需要对重建参数进行灵活调整从而得到较好的重建结果,在实际运用中,这两种算法往往比较繁琐,且重建结果受到采样点数和重建点数的限制.由于SPEN在相位编码维采用的带宽较大,从而使其对采样率有了更高的要求.在实际应用中,SPEN通常以欠采样的方式采集信号,使得其在相位编码维不满足奈奎斯特采样定律,导致其低分辨率图像中会产生伪影[13]. Chen等人提出的增强和边缘伪影去除法[16](Super-Resolved Enhancing and Edge Deghosting,SEED)通过探究SPEN超分辨率重建的质子密度分布与真实质子密度分布之间的关系,利用与混叠伪影相关的额外二次相位信息来构建先验信息,可以在不损失空间分辨率的情况下移除混叠伪影,使重建结果达到理论上的最优空间分辨率.然而该算法在重建过程中需要进行迭代求解,计算量较大、重建速度较慢.以上算法从二次相位调制的角度重建SPEN低分辨率图像,然而在图像域中伪影的产生往往难以解释,Zhong等人提出了一种从k空间视角去除混叠伪影并重建SPEN低分辨率图像的算法[17],该算法在k空间中以卷积矩阵的形式来描述SPEN采样信号的二次相位调制,并将SPEN超分辨率重建问题转化为反卷积问题,同时通过估计全采样和欠采样SPEN信号之间的差异来量化混叠伪影和边缘伪影,并采用压缩感知重建框架,使用非线性共轭梯度下降算法求解优化问题,最终重建出无伪影的SPEN超分辨率图像.
基于深度学习的重建算法在图像视觉及医学MRI影像领域取得了巨大的成功,其通过学习低分辨率图像到高分辨率图像之间的映射关系来进行重建[18,19].在MRI超分辨率重建方面,Bouter等人提出了一种基于深度学习的低场MRI超分辨率重建算法[20],该算法使用配对的低场低分辨率图像及高场高分辨率图像对卷积神经网络模型进行训练,然后在测试阶段输入低场低分辨率图像便可快速重建出清晰的高分辨率图像.Song等人提出了一种基于残差网络的脑部MRI超分辨率重建算法[21],该算法利用平均绝对误差损失的变体Charbonnier损失和梯度差分损失(Gradient Difference Loss)能够较好地处理异常值和锐化图像的特性,将这两种损失结合起来对网络模型进行训练,从而提高了训练模型的鲁棒性.
尽管卷积神经网络在图像恢复领域取得了广泛的应用,但其在提取图像像素长距离依赖关系方面表现出了一定的局限性.Transformer是一种通过注意力机制来学习全局依赖关系的神经网络模型[24],与卷积神经网络相比,Transformer可以更好的学习特征图的局部信息和长距离依赖关系,该模型已被广泛用于自然语言以及自然图像处理任务[25⇓-27].为了将Transformer应用于计算机视觉领域,谷歌团队于2020年提出了视觉Transformer[28](Vision Transformer,ViT),该方法将输入图像分成多个16×16的块,并把这些块通过全连接层压缩成高维向量后输入Transformer进行网络训练,与卷积神经网络相比,ViT在图像分类任务中取得了更为优秀的结果.为降低自注意力机制的计算复杂度,Liu等人提出了Swin Transformer架构[29],该架构用非重叠的窗口将特征图划分为数个大小相等的块,并在窗口内部进行局部自注意力计算,由于每个窗口中的图像块大小固定,因此自注意力机制的计算复杂度与输入图像大小呈线性关系,与二次关系相比大大减少了计算量.近年来,基于Transformer的方法在低级视觉任务中也逐渐兴起,常见的如IPT[30]、SwinIR[31]、Restormer[32]、Uformer[33]等模型在图像恢复中展现出了良好的性能,这些模型旨在从低质量的图像或视频中恢复出高分辨率的结果.
1 实验部分
1.1 SPEN成像原理
MRI中较为常用的多次扫描FSE序列与超快磁共振SPEN序列对比示意图. (a) FSE序列及其图像; (b) SPEN序列及其图像和超分辨率重建图
Fig. 1
The comparison of multiple scan FSE sequence and ultrafast magnetic resonance SPEN sequence commonly used in MRI. (a) FSE sequence and its image; (b) SPEN sequence and its image and super-resolution reconstruction image
1.2 SPEN超分辨率重建原理
1.3 网络结构
本文所提算法的网络框架如图2所示,该网络模型由编码器-解码器结构组成.编码器包含k个模块,每个模块由两个Transformer层和一个下采样层组成.编码器的第一个模块额外包含一个输入投影层(Input Projection)用于提取输入SPEN低分辨率图像的低级特征,并输出特征图
Fig. 2
The SPEN super-resolution reconstruction network structure diagram proposed in this article
与编码器相同,解码器共由k个模块组成,每个模块包含两个Transformer层和一个上采样层,解码器的最后一个模块还额外包含一个输出投影层(Output Projection).其中输出投影层由卷积核大小为3×3,步长为1的卷积组成,用于将输出特征图恢复为残差图像
常规Transformer模型[35]中的自注意力机制需要计算输入特征图中所有元素之间的相关性,计算复杂度为O(H2W2C).这意味着,当输入特征图的尺寸增加时,Transformer模型的计算复杂度会呈平方级别增长,因此Transformer模型不适用于处理高空间分辨率的图像.此外,超分辨率重建主要利用相邻像素之间的相关性,距离越近的像素其关联层度越高,而Transformer在捕获局部上下文信息方面表现出了一定的局限性[36,37].为了更好地捕获输入特征图的局部上下文信息并降低自注意力的计算成本,本文引入局部增强窗口(Locally-enhanced Window,LeWin)Transformer模块[33].如图3所示,LeWin Transformer主要由基于窗口的多头自注意力(Window-based Multihead Self-Attention,W-MSA)和局部增强前馈(Locally-enhanced Feed-Forward,LeFF)网络组成.
本文采用的LeWin Transformer模块示意图,主要包括W-MSA和LeFF两部分
Fig. 3
The schematic diagram of the LeWin Transformer module used in this article mainly includes two parts: W-MSA and LeFF
1.4 评价指标
本文使用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和结构相似性(Structure Similarity Index Measurement,SSIM)作为仿真数据集的评价指标.PSNR用来衡量图像质量的好坏,PSNR越高说明图像质量越好;SSIM用来比较真实图像与重建图像之间的相似度,范围在0到1之间,SSIM越接近1说明重建图像与真实图像之间的差距越小.PSNR和SSIM的计算式如下:
1.5 数据集与实验参数
本文训练数据集包括临床数据集以及临床前数据集两种.其中临床数据集由HCP网站[38]中公开的人脑结构图像作为人脑仿真数据的参考图像,并通过脉冲序列仿真生成SPEN低分辨率图像;临床前数据集由武汉磁共振中心Bruker Biospec 7T小动物成像仪上分别使用FSE序列、单扫描EPI序列和单扫描SPEN序列对活体大鼠脑袋进行数据采集获取.其中FSE图像作为大鼠脑仿真数据的参考图像,并通过SPEN脉冲序列仿真生成的SPEN低分辨率图像用于临床前数据的超分辨重建网络训练;实际采集的单扫描SPEN低分辨率图像用于作为测试数据集;单扫描EPI图像作为与SPEN数据的对比图像.在网络训练阶段,本文分别使用人脑结构图像或者大鼠脑FSE图像作为标签数据、其对应的脉冲序列仿真SPEN低分辨率图像作为网络输入进行有监督训练.为验证Transformer超分辨率重建算法在实采数据上的重建效果并测试其泛化能力,本文采集了小鼠脑临床前数据进行了测试,并与FSE和EPI序列进行了对比.
所有动物实验均按照国家卫生研究院动物护理指南进行,并且实验程序经过中国科学院精密测量科学技术创新研究院动物伦理委员会批准(APM2022A).在大鼠以及小鼠磁共振成像实验中,通过使用异氟烷与氧气混合以麻醉大鼠以及小鼠(4.0%~5.0%用于刺激诱导,0.5%~1.0%用于维持成像).在扫描期间,持续监测麻醉状态下大鼠以及小鼠的呼吸频率(30~50次/min),并通过37 ℃的水循环维持大鼠以及小鼠体温.FSE序列的采集参数如下:重复时间(TR)为2 500 ms,有效TE为32 ms,回波数为8,层厚为1 mm,视野大小为35 mm×35 mm(大鼠)/20 mm×20 mm(小鼠),采集矩阵为256×256;单扫描EPI序列的采集参数为:TR为2 500 ms,TE为32 ms,层厚为1 mm,带宽为500 kHz,视野大小为35 mm×35 mm(大鼠)/20 mm×20 mm(小鼠),采集矩阵为96×96;单扫描SPEN序列的采集参数与单扫描EPI序列上述参数相同,SPEN序列的R值为120.仿真生成的SPEN超分辨率编码系数矩阵的参数与单扫描SPEN序列的采集参数保持一致.
本文提出的网络算法基于Pytorch搭建,采用AdamW优化器更新网络参数,其超参数为β1=0.9,β2=0.999,ε=10-8.网络训练的批数据大小设置为4,初始学习率设置为0.000 2,并使用Warm-up策略对学习率进行动态调整.λ的值设置为0.1,以保持各项损失函数对总函数的影响处于同一水平.实验用的硬件配置为NVIDIA GeForce GTX 2080,内存为128 GB,操作系统为Ubuntu 20.04.
2 结果与讨论
2.1 仿真数据结果分析
Fig. 4
The comparison of reconstruction results with different SPEN super-resolution algorithms on the simulated Rat brain dataset
各种SPEN超分辨率算法在大鼠脑仿真数据集上的统计重建指标对比. (a) PSNR;(b) SSIM
Fig. 5
The comparison of statistical indicators with different SPEN super-resolution algorithms on the simulated rat brain dataset. (a) PSNR; (b) SSIM
The comparison of reconstruction results with different SPEN super-resolution algorithms
on the simulated HCP T1weighted dataset
各种SPEN超分辨率重建算法在HCP人脑仿真数据集上的统计指标对比. (a) PSNR;(b) SSIM
Fig. 7
The comparison of statistical indicators with different SPEN super-resolution algorithms on the simulated HCP T1 weighted dataset. (a) PSNR; (b) SSIM
2.2 实采数据结果分析
Fig. 8
The comparison of reconstruction results with different SPEN super-resolution algorithms on real in vivo mice dataset acquired with Bruker
2.3 讨论
由于Transformer重建算法在训练时需要配对的训练数据,而真实的实验环境往往受到各种因素的干扰,难以获得配对的参考图像,因此本文基于SPEN MRI原理,采用仿真数据制作方法生成SPEN图像以获取训练样本.
表1 不同因素影响下的消融实验
Table 1
方法 | PSNR/dB | SSIM | FLOPS | 模型参数/MB |
传统迭代重建 | 31.08 | 0.8928 | - | - |
U-Net重建 | 38.58 | 0.9812 | 5.48 | 5.3 |
Transformer (C=12) | 38.85 | 0.9801 | 4.42 | 3.0 |
Transformer (C=24) | 45.22 | 0.9928 | 16.14 | 11.6 |
Transformer (C=48) | 53.31 | 0.9983 | 61.48 | 46.2 |
Transformer (T=1) | 42.34 | 0.9877 | 8.71 | 6.8 |
Transformer (T=2) | 45.22 | 0.9928 | 16.14 | 11.6 |
Transformer (T=3) | 45.41 | 0.9928 | 23.57 | 16.4 |
Transformer (Without GDL) | 42.83 | 0.9901 | 16.14 | 11.6 |
Transformer (With GDL) | 45.22 | 0.9928 | 16.14 | 11.6 |
3 结论
图S1 各种SPEN超分辨率算法在大鼠脑仿真数据集上的Bland-Altman图
图S2 各种SPEN超分辨率算法在HCP人脑仿真数据集上的Bland-Altman图
图S3 不同损失函数的消融实验
图S4 不同特征通道数的消融实验
图S5 不同Transformer层数的消融实验
