技术文章|早期肺结核检测

摘 要 肺癌在全世界范围内的发病率和死亡率居高不下,其早期的诊断和治疗能够有效提高患者的生存率。肺结节是肺癌早期的主要表现形式,因此对肺部可疑的肺结节进行定位与诊断具有重要意义。肺结节的形态特征和周围环境较为复杂,且可能被误认为邻近器官。随着计算机断层扫描技术的发展,仅凭放射科医生肉眼评估和诊断,需要消耗大量的时间和精力,易造成漏诊或误诊等问题。因此,肺结节早期检测任务具有一定的挑战性。计算机辅助诊断技术通过定位可疑病灶区域供医师参考,能够提高诊断效率并降低人工阅片的主观性和不稳定性。本文以提高辅助诊断系统的性能为研究目标,分析了现有医学图像处理方法的优劣势,针对肺实质分割和肺结节检测两大关键技术展开研究。计算机辅助诊断系统可以帮助医生对肺结节进行检测,降低误诊率和漏诊率,有效提高检测效率和精确度,对肺癌的早期检测具有重要意义。本文采用深度学习的相关方法,深入研究与分析了肺结节检测模型与算法,同时对目前方法的不足之处进行优化和改进,从而提升模型的检测速度、检测精确度以及敏感度等。
主要研究内容如下:提出基于残差 U-Net 的肺结节检测模型与算法,获得了较高的分割性能和检测敏感度,从而提高了检测的准确率。候选结节检测阶段,通过改进原始 U-Net 网络提出残差U-Net候选结节分割网络。添加残差网络模块改进网络结构,提升网络特征提取性能;改进损失函数解决训练数据类别不平衡问题,以获得更高的敏感度。假阳性减少阶段,使用三维卷积神经网络进行分类,可以充分提取结节的空间信息,增强肺结节的特征提取性能。实验结果表明,该算法有效提高了肺结节的检测性能,获得了较好的检测敏感度和精确度。提出多策略融合的肺结节检测模型与算法,进一步提升对肺结节的检测效率。候选结节检测阶段,提出基于循环残差注意力门机制的 U-Net候选结节分割模型。在网络结构中添加循环残差卷积模块,同时融合注意力门机制,从而抑制肺部图像中的无关特征,将注意力放在结节区域;改进损失函数解决肺结节图像数据不平衡问题,以提高检测的敏感度。最后通过三维卷积神经网络分类候选结节降假阳性。实验结果表明,该方法直接输入肺部图像进行检测,可以更加高效准确的检测肺结节。
关键词 计算机辅助诊断,肺结节检测,深度学习,残差网络,注意力机制
绪论 根据 2020 年癌症统计表明[1],肺癌患者五年的生存率仅为 19%,是导致癌症死亡的主要原因之一。在我国过去四十年中,肺癌占中国癌症死亡人数的 27.3%,同样是造成患者死亡的主要原因。导致患者生存率较低的主要原因是大部分患者在中晚期才被确诊,或者在确诊时已经成为转移性疾病。由此可见,对肺癌早期诊断是提高患者生存率的重要途径,可以为医生后期的临床治疗提供有效依据。
肺癌的主要表现形式为生长速度迅速增加的异常细胞,在肺内形成一个称为肺结节的肿块。肺结节作为肺癌的早期表现形式[2],与癌症有着较为复杂的联系。肺结节的存在不一定意味着患癌,但仍需要精确仔细的分析每一个可疑结节,才能更好的为早期诊断肺癌提供有效方法。肺结节具有体积小、形态复杂、早期发现较为困难且易被误认为邻近器官等特征,因此对其检测和诊断是一项具有挑战性的任务。随着计算机断层扫描技术的不断发展,其逐渐成为目前医学检测和诊断疾病所使用的主要方式之一。目前肺结节检测一般采用肺部 CT 图像进行分析,然而随着医学成像技术的发展,肺部 CT 图像的扫描速度和成像数量的提升使得人工检测耗时严重,给放射科医生带来较大的工作负担。同时 CT 图像中的病灶可能存在表现不明显或变化多样等特点,使得检测具有一定难度,需要医生具备较为丰富的经验知识,仅凭医生肉眼观察易产生漏诊和误诊[3]影响检测结果和后期治疗。
计算机辅助诊断系统采用计算机的相关技术,结合医学图像处理等手段,可以辅助医生高效的对疾病进行诊断。在肺结节检测任务中,通过辅助医生检测肺部区域病灶,可以有效提高肺结节检测的效率和准确率。随着计算机硬件和软件等技术的高速发展,计算机逐渐具备强大的存储和计算能力来处理海量数据,因此相继出现了基于机器学习、和深度学习等优秀的算法用于解决肺结节检测问题,从而更好的帮助医生提高诊断效率,进一步提升患者的生存率。
研究表明,针对肺结节的检测可以为肺癌的诊断提供相关依据,从而提高患者的生存率。因此利用计算机辅助诊断系统对肺结节进行检测和分类,同时结合深度学习等优秀算法进行研究,可以有效提升检测性能,对医生的诊断和治疗意义重大。
2.相关理论知识 2.1 人工神经网络及深度学习 人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。
最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
人工神经网络(Artificial Neural Network, ANN)是早期机器学习的重要算法,其最小的核心单元是人工神经元,其中神经元的计算过程如公式 2-1 所示:
技术文章|早期肺结核检测
文章图片
(2-1)
式中, 表示输出, 表示输入向量的分量, 为分量的权重, 为神经元的偏置, 为神经元的激活函数,人工神经元的基本结构如图 2-1 所示。
技术文章|早期肺结核检测
文章图片

将人工神经元按层堆叠连接,其中一个神经元的输出作为另一个神经元的输入,构成的人工神经网络可以用来执行复杂的任务。如图 2-2 所示是三层人工神经网络的具体结构,其中网络的输入层用来获得外部数据;输出层用来输出最终处理结果;隐藏层用来处理数据,其数值在训练样本中是不能被外部观察到的。
技术文章|早期肺结核检测
文章图片

人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。人工神经网络具有四个基本特征:
(1)非线性:非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性关系。具有阈值的神经元构成的网络具有更好的性能,可以提高容错性和存储容量。
(2)非局限性:一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。
(3)非常定性:人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。
(4)非凸性:一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。
人工神经网络通过添加隐藏层增加网络层数,逐渐发展为多层感知器,可以用来解决非线性分类的问题[34]。随着网络的进一步发展构成了深层神经网络模型,并提出了深度学习的概念,该网络含有多个隐藏层,可以训练并学习大量样本数据的内在规律和表示,使机器像人一样解决较为复杂的问题。典型的深度学习模型主要包括卷积神经网络、深度信念网络[35](DBN)和堆栈自编码器网络(SAE)等。卷积神经网络是通过卷积运算的深层网络,可以自动从大规模数据中学习特征,目前在计算机视觉等领域表现出较好的性能。
2.2 卷积神经网络 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为“平移不变人工神经网络(Shift-Invariant Artificial Neural Networks, SIANN)”。
对卷积神经网络的研究始于二十世纪80至90年代,时间延迟网络和LeNet-5是最早出现的卷积神经网络;在二十一世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。
卷积神经网络包括局部区域连接、权重共享和降采样三个关键思想,有效简化深层网络的参数、高效提取图像特征同时缓解过拟合等问题。局部区域连接使得每个神经元感知局部图像范围,从而简化模型复杂度并减少参数数量;权重共享利用同一卷积核扫描整张图像,采用相同权重可以减少参数、加快网络训练;降采样通过对特征图采样可以有效的减少数据量同时保留有效信息。卷积神经网络结构如图 2-3 所示,接下来将详细对其组成部分进行讲解。
技术文章|早期肺结核检测
文章图片

2.2.1 卷积层(convolutional layer)
卷积层对输入数据进行特征提取,通过卷积操作可以减少参数数量、提高特征维数,是卷积神经网络的主要组成部分。卷积是将卷积核在特征图上滑动并进行运算的操作,具体运算过程是将卷积核与图像做内积计算,即相乘后求和。其中,卷积核的大小、数目和步长的不同都会对卷积结果产生不同的影响。如图 2-4 定义了一组输入特征图像与卷积核,分别为 5×5 的特征图像和 3×3 的卷积核。
技术文章|早期肺结核检测
文章图片

将图 2-4 所定义的输入特征图像与卷积核进行卷积运算,其具体运算操作和输出结果如图 2-5 所示。将定义的卷积核在输入的特征图像上滑动 1 个步长,将所对应位置的每个元素做内积计算,相乘后求和得到卷积结果,将所得结果存入输出特征图中,最后输出特征映射结果。
技术文章|早期肺结核检测
文章图片

卷积运算的计算公式如 2-2 所示:
技术文章|早期肺结核检测
文章图片

公式表示输入第 层经过卷积运算输出第 层的特征图像,式中 表示第 层的第 个特征, 表示第 层的输出特征, 表示第 层对应的卷积核, 表示第 层的第 j 个偏置值,通过第 层的每个特征 与卷积核 进行卷积操作,与偏置值 相加,最后通过 非线性激活函数得到输出的特征映射。
2.2.2 池化层
经过卷积层得到的图像特征并非全部都是有效特征,使用大量数据直接进行分类易产生过拟合等问题,同时计算量也较大。因此为了进一步减少参数,同时保留重要的特征信息,通常在卷积层后设置池化层,对数据进行降维。如图 2-6 所示为目前常用的最大值池化(Max Pooling)和平均值池化(Mean Pooling)两种池化操作,分别通过滑动窗口选择所有像素点的最大值和取平均值进行计算。
技术文章|早期肺结核检测
文章图片

2.2.3 激活函数
激活函数(Activation Function)可以去除部分冗余特征并保留图像特征,目前常见的激活函数包括 sigmoid、 tanh和 ReLU 等。
(1)sigmoid激活函数sigmod 激活函数可以将输入变量映射到 0 和 1 的范围之间得到输出结果,是通常可以用来做二分类的一种非线性激活函数。sigmoid函数的具体公式如 2-3 所示:
技术文章|早期肺结核检测
文章图片

sigmoid激活函数可以将每个元素压缩到(0,1)范围内是一种S型饱和函数,这种饱和函数在平滑区域会使得神经元梯度消失,导致无法进行反向传播;该函数不以 0 为中心,会使得梯度更新的效率较低;同时在公式中使用了指数函数,使得计算代价较高。如图 2-7 所示是sigmoid激活函数的曲线图。
技术文章|早期肺结核检测
文章图片

【技术文章|早期肺结核检测】(2)ReLU激活函数ReLU
激活函数是目前常用的激活函数,其公式如 2-5 所示:
技术文章|早期肺结核检测
文章图片

(2-5)
当输入 时,输出为 0 ;当输入 时,输出为 。ReLU激活函数相比 sigmoid更具有生物上的合理性,其稀疏性使得计算速度和收敛速度较快,且不涉及指数运算计算成本相对较低。其在正半轴上不会产生饱和现象,可以避免一定的梯度消失问题,但在负半轴可能出现梯度消失;同时其输出仍然不以 0 为中心。如图 2-9 所示是 ReLU 激活函数的曲线图。
技术文章|早期肺结核检测
文章图片

目前, ReLU仍然是最常用的激活函数,为了解决 ReLU激活函数的一些问题同时保留其好的部分,对其进行改进出现了如 Leaky ReLU、P ReLU 和 ELU 等激活函数。
2.2.4 全连接层
全连接层在卷积神经网络中起到分类器的作用,通常在卷积和池化操作后进行添加,主要作用是可以对其之前结构层所提取特征分类。全连接层与上一层所有结点相连接,可以将所提取特征整合为特征向量后传给下一层,最后一层全连接层传递给输出层,最终完成对结果的分类任务。
3 基于残差 U-Net 的肺结节检测模型与算法 随着深度学习技术在医学图像领域取得广泛的发展与应用,其检测效果逐渐优于传统方法,采用该方法对肺结节检测,可以有效提高检测准确率和敏感度。本章介绍的肺结节检测模型与算法包括候选结节分割和假阳性减少两个阶段,第一阶段主要提出基于残差 U-Net 结构的肺结节检测模型与算法,将残差网络与 U-Net 结构相结合分割候选结节;第二阶段采用 3D CNN 网络进一步降低假阳性检测肺结节。
3.1 数据预处理 本章采用 LUNA16 数据集对肺结节检测模型与算法进行研究,该数据集是由多张不同数量的二维切片图像组成的三维医学影像,包含肺部多个轴向切片。首先需要从数据集的mhd文件中读取出 CT 图像信息,之后通过一系列的图像处理方法对肺实质进行分割,去除肺实质之外的其他组织器官,最终得到只包含肺部实质的图像,以防止其他组织器官对肺结节检测造成干扰。本节主要针对数据集预处理步骤进行介绍,具体处理步骤如图 3-1 所示。
技术文章|早期肺结核检测
文章图片

LUNA16 数据集预处理首先需要读取原始 CT 图像中的数据信息,该数据集由十个包含 CT 图像的子集以及包含参考标准注释的csv文件构成,其中每个 CT 图像均由mhd和 raw 格式的文件组成,分别包含图像的基本信息和具体数据信息。本章通过 Python中的 SimpleITK 库读取mhd 格式文件中的图像数据,之后对所提取图像进行图像处理操作分割肺实质部分。从 LUNA16 数据集中读取到的 CT 图像为整个肺部图像,主要包括肺部及其周围组织器官,其中诸如血管、支气管和骨骼等组织可能对后续肺结节检测造成一定的影响,因此需要分割肺实质,去除肺部以外的其他组织器官。本章采用图像处理方法对肺实质进行分割,图 3-2 展示了肺实质分割主要采用的方法,具体实现步骤如下:中北大学学位论文20首先对原始 CT 图像进行二值化,标记图像像素,将整个图像转化为灰度图像,利用图像像素的亮度分布分离图像,得到肺部轮廓区域如图 3-2(a)所示。然后采用图像形态学操作对灰度图像进一步处理消除肺部小空洞区域,具体采用腐蚀和膨胀操作,腐蚀操作减小高亮区域如图 3-2(b)所示,膨胀操作增加高亮区域如图 3-2?所示。之后标记肺部连通区域如图 3-2(d)所示,获得图 3-2(e)所示的肺部掩模区域,最终与原始 CT 图像进行与操作分割肺实质部分,如图 3-2(f)所示。为避免信号强度不一致造成特征提取不准确,需要将像素强度范围裁剪为[-1000, +400]之间,并将其归一化至(0, 1)范围之间。
技术文章|早期肺结核检测
文章图片

数据预处理部分通过读取原始 CT 图像、肺实质分割和归一化等图像处理操作,完成了初步的预处理步骤,得到肺部感兴趣区域部分,之后将预处理所获得的肺部图像作为网络的输入部分进行后续检测。
3.2 RU-Net网络结构设计 在候选结节检测阶段,本章设计了一种基于残差 U-Net(Residual U-Net, RU-Net)的候选结节分割网络,具体框架如图 3-3 所示。首先将肺部 CT 图像通过数据预处理分割肺部区域,得到肺实质部分数据集,将其输入到设计的 RU-Net 分割网络中,最终分割获得候选结节掩模,将其标注在原始肺部 CT 图像上。
技术文章|早期肺结核检测
文章图片

为改进现有肺结节检测系统的不足之处,减少肺结节检测任务中的误诊率和漏诊率,需要在候选结节检测阶段尽可能多的检测到全部可疑结节。本章提出的 RU-Net 候选结节分割网络主要改进了网络结构和损失函数,可以获得较高的检测敏感度和检测精确度,从而尽可能多的检测到肺部 CT 图像中所有的候选结节。同时采用二维网络结构可以充分节省时间和空间的利用,进一步提高检测效率。本节将详细介绍所提出的 RU-Net 模型在网络结构和损失函数两方面的改进方法。
3.2.1 U-Net网络结构
U-Net 网络是由 Ronneberger 等人[16]提出的语义分割网络,该网络通过改进全卷积神经网络,在提取物体语义特征的同时可以获得图像中的精准定位,在语义分割特别是医学图像的分割方面获得了较好的效果。同时由于医学图像有时无法获得较多的数据,采用 U-Net 网络可以适应较小的训练数据集,为医学图像检测任务提供了解决思路,如图 3-4 所示是 U-Net 网络结构图。
技术文章|早期肺结核检测
文章图片

U-Net 网络是一种对称的 U 型网络,主要由编码器(Encoder)和解码器(Decoder)构成,分别用来提取图像深层的上下文特征信息;精确定位并恢复图像的细节和空间维度信息。同时 U-Net 网络利用跳跃连接拼接两组特征,将解码器部分结果与编码器中相同分辨率模块的输出通过叠操作(Concatenation)拼接,作为解码器下一模块的输入,起到补充完善分割过程中语义和空间细节信息的作用,可以提高分割精度。U-Net 主要特点是其下采样和上采样部分完全对称,并且下采样部分的特征图可以通过跳跃连接跳过深层采样直接与上采样层相拼接。U-Net 网络最早被提出即被应用在医学影像的语义分割中,由于医学影像数据量相对较少,并且医学图像语义特征相对简单、结构特征较为固定,因此在医学图像分割任务中取得了较好的表现。然而,U-Net 网络仍然存在一些问题有待解决,网络中连续的池化和跳跃连接操作可能导致空间信息的丢失;跳跃连接直接将编码器和解码器进行拼接,会导致所提取特征之间出现语义鸿沟[46]问题;网络可能造成对特征表达不准确等问题从而损失检测精度。为解决上述问题,近年来研究人员利用 U-Net 网络较好的泛化性能针对不同的特定问题进行改进,相继提出了如 GC-Net[47]、CE-Net[48]、U-Net++[49]和MultiResUNet[46]等基于 U-Net 结构的改进模型,分别在不同的医疗影像数据集上获得了优秀的表现。
3.2.2 改进的网络结构
本章提出的 RU-Net 候选结节分割网络,其结构主要为卷积层和残差块组成的模块,改进的网络结构将该模块添加在 U-Net 的编码器和解码器中,输入预处理好的数据集进行训练分割候选结节。结构上每层都由卷积层和残差块相结合构成,网络中的卷积层均由 3×3 的卷积核构成,每个卷积层后均采用 ReLU激活函数加速训练同时防止过拟合,卷积核的数量分别为 32,64,128,256 和 512。其中编码器部分采用 2×2 的最大池化层,解码器采用 2×2 的上采样操作,跳跃连接部分由串联不同数量的残差块替代以减少特征间的语义鸿沟。整个网络除输出层外均采用 ReLU激活函数用于加快计算和收敛速度同时防止过拟合,最后输出层采用sigmoid激活函数分类输出最终分割结果。RU-Net 在网络结构方面的改进主要融合了 ResNet网络结构的思想,分别在编码-解码器和跳跃连接中采用残差网络模块,改进网络结构提升特征提取性能,下面将分别从两个改进方面进行介绍。
(1)将原始网络中的卷积层替换为卷积层与残差块相结合的模块,从而增加原始网络的深度提升网络性能,进一步提高网络的特征提取能力,获得更为丰富的候选结节特征。随着网络层数的不断加深会出现退化问题,残差网络可以解决这一问题使网络收敛的更快。残差块是包含短路连接的网络结构,残差网络主要由一系列的残差块构成。残差块在向前传播和反向传播时,可以分别解决网络退化和梯度弥散等问题。残差块中的短路连接使信号在向前和向后的传播更加顺畅,残差块的结构如图 3-5 所示。
技术文章|早期肺结核检测
文章图片

当网络的输入为 x ,激活函数之前的输出特征为 H(x) ,此时学习的残差如公式 3-1所示。
技术文章|早期肺结核检测
文章图片

(3-1)
网络通过短路连接将残差 和所添加的 的同等映射 x 逐元素相加,将原函数转化为 ,最后通过 ReLU激活函数输出构成一个残差块。本章添加的残差块如图 3-6 所示,其中图中的 weight 是两层卷积核为 3×3 的卷积操作,在每个卷积操作之前均采用批量标准化[50](Batch Normalization, BN)和 ReLU激活函数进行处理,最后将其与输入同等映射lx逐元素相加,得到最终的输出lx。其中采用 BN 操作可以使网络输入保持相同分布,提升网络的训练速度,提高模型的泛化能力。本章所提出的 RU-Net 网络在结构上的第一步改进是将原始 U-Net 网络中的卷积层均替换为卷积层与残差块相结合的模块,使得网络深度增加提升检测性能。在增加网络深度的同时防止梯度爆炸和网络退化等问题,进一步提高网络检测的准确率。
技术文章|早期肺结核检测
文章图片

(2)将原始的跳跃连接部分由提出的残差跳跃连接替代,残差跳跃连接通过串联不同数量的残差块构成,通过添加不同长度的残差跳跃连接,减弱编码器和解码器之间直接拼接产生的语义差异。
原始 U-Net 网络可以通过跳跃连接拼接浅层与深层特征,然而原始网络的不同特征之间可能存在语义鸿沟,使得跳跃连接所拼接的特征之间产生一定的语义差异,造成拼接特征之间的细节信息丢失,对模型的分割效果造成一些不利影响。本章引入并改进MultiResUNet 网络中的 Res Path 结构,提出残差跳跃连接替换原始 U-Net 网络中的跳跃连接,从而弥补特征映射之间的差异造成特征细节丢失等问题。具体改进结构是串联不同数量的残差块组成长度不同的残差跳跃连接,其中每个残差块由 3×3 和 1×1 的卷积层并联相加组成。在编码器和解码器不同深度的跳跃连接中串联不同数量的残差块拼接特征,如图 3-7 所示是串联了三个残差块的残差跳跃连接结构。
技术文章|早期肺结核检测
文章图片

U-Net 结构随着网络的加深,特征映射之间的语义差距强度也在不断减小,因此随着深度的增加需要逐渐减少残差跳跃连接中串联的残差块数量,本章所提出的残差跳跃连接分别由串联了 3,2 和 1 个残差块的结构构成,另外语义差距最小的两组特征之间直接采用原始跳跃连接拼接。这种残差跳跃连接方式使得深层网络的学习更容易,同时减少两组拼接特征之间的语义差距,更加精确的拼接融合浅层和深层特征信息,提高对候选结节的分割性能。
3.2.3 改进的损失函数
原始 U-Net 网络采用基于 Dice 相似系数的损失函数用来比较预测结果和真实结果样本元素之间像素级的相似度,具体如公式 3-2 所示。
技术文章|早期肺结核检测
文章图片

(3-2)
式中 表示预测值, 表示真实标签值。基于 Dice 相似系数的损失函数可以解决部分背景区域和分割区域面积对比之间的不平衡问题,在训练数据不均衡情况下也能获得较好的准确率。然而有时 Dice 损失函数会造成训练曲线不可信,有时造成剧烈的梯度变化导致训练较为困难,可能在网络的分割过程中丢失部分真实结节。候选结节分割的主要目标是在整张肺部 CT 图像中检测并分割出较小目标的候选结节,由于一张肺部 CT 图像中往往仅包含极少部分的候选结节,且仅占据整张图像较小比例的像素范围,候选结节这一分割目标造成了图像背景和目标区域间类别不均衡问题。针对医学图像的检测任务中,往往假阴性(FN)比假阳性(FP)更难以容忍,因此需要尽可能多的检测出所有可疑病灶提高检测敏感度,防止在检测过程中出现漏诊等问题。因此本章改进损失函数来解决分割任务中的类别不均衡问题,选择合适的损失函数优化网络分割候选结节,关注较小目标并对其精确分割。为解决医学图像中分割数据不均衡问题 Salehi 等人[51]提出了基于Tversky 相似系数的损失函数,其定义如公式 3-3 所示。
技术文章|早期肺结核检测
文章图片

式中 表示预测值, 表示真实标签值,通过调整超参数 可以控制 FN 和 FP 之间的平衡。具体表现为,由 控制假阳性即误诊率,是将阴性样本错误预测为阳性样本的概率;由 控制假阴性即漏诊率,是将阳性样本错误预测为阴性样本的概率。Tversky相似系数是一种广义系数,当 时,该系数为 Dice 相似系数;当 时,该系数为 Jaccard 相似系数。本章在所提出的 RU-Net 网络中具体采用基于 Tversky相似系数的损失函数对候选结节分割,通过调整超参数 的取值进行对比实验,控制 FN 和 FP 之间的权衡,以降低漏诊率、提高检测敏感度。
3.3 CNN分类网络 RU-Net 候选结节分割网络通过较高的检测敏感度和较快的检测速度尽可能多的检测出所有候选结节,获得了丰富的结节信息,需要进一步从大量候选结节中去除假阳性结节,准确检测出真实结节。由于肺结节形态是类球形的局限性异常组织,需要考虑其复杂的空间上下文环境信息,关注 CT 图像连续切片中结节的变化情况。本章在假阳性减少阶段构建了基于 3DCNN 的分类网络模型,进一步对所分割的候选结节分类,减少假阳性结节并准确鉴别出真实肺结节。在分类阶段采用三维结构可以更好的利用结节丰富的空间上下文特征信息,达到更加精确的分类效果,其网络结构如图 3-8 所示。
技术文章|早期肺结核检测
文章图片

将上一阶段通过 RU-Net 候选结节分割网络获得的二维候选结节图像中以结节为中心的矩形区域进行截取,将所截取的切片区域堆叠转化为 32×32×8 的三维图像作为 3DCNN 分类网络的输入数据。网络采用图 3-8 所示的三维卷积层和三维最大池化层交替进行特征提取,网络采用二元交叉熵损失函数度量分类的损失。在网络结构中加入 Dropout层,同时在卷积层采用 L2 正则化方法,用来防止网络模型在训练过程中出现过拟合等问题。
3.4 实验结果与分析 3.4.1 评估指标
为衡量本文所提方法的检测效果,具体采用了 Dice 相似系数值(DSC)、敏感度(Sensitivity)、特异度(Specificity)、准确率(Accuracy)和受试者操作特性(ROC)曲线下面积(AUC)作为网络的评估指标。在本文提出的肺结节检测任务中,将定义阳性(Positive,P)为恶性结节,阴性(Negative,N)为良性结节。通过真实标签和预测值对预测结果进行描述,所得预测结果具体描述如表 3-1 所示。
技术文章|早期肺结核检测
文章图片

表3-1 预测结果
Table3-1 Predicted results
Dice 相似度系数值是一种重要的分割评价系数,可以用来衡量医学图像的分割性能,评估预测值与真实标签之间的相似度,值越大其相似程度越高;敏感度指正确检测为有肺结节总数所占真实值总数的比例,用来反应发现病人的能力,敏感度越高其漏诊率越低;特异度指正确检测为无肺结节所占真实值总数的比例,特异度越高其误诊率越低;准确率指正确分类肺结节的能力;AUC 用来评估假阳性减少阶段的分类性能,AUC 值越大分类效果越好。以上评估指标的具体公式如下:
技术文章|早期肺结核检测
文章图片

技术文章|早期肺结核检测
文章图片

技术文章|早期肺结核检测
文章图片

技术文章|早期肺结核检测
文章图片

Tversky损失函数超参数选取对比实验基于 Tversky相似系数的损失函数可以通过其超参数? 的取值控制假阳性和假阴性之间的平衡,为改善训练过程中数据的不平衡问题进一步提高检测敏感度,本章在原始U-Net 网络上对比训练了不同取值的超参数在候选结节检测阶段的性能,如表 3-2 所示。
技术文章|早期肺结核检测
文章图片

表3-2 U-Net网络上训练Tversky损失函数不同的 值
Table3-2 Training the Tverskyloss function for different values of on the U-Net network
实验结果表明,Tversky 损失函数的超参数? 可以有效控制敏感度和特异度之间的平衡;设置超参数可以在损失较少检测精度的情况下,有效提高候选结节分割的敏感度;当超参数 时,取得最优的 Dice 系数为 0.7333、特异度为 99.95%;当超参数 时,取得最优的损失值为 0.2989、分割敏感度为 91.24%,相比较原始 Dice 损失函数牺牲了一定的分割精度,但获得了更高的敏感度。本章为尽可能多的获得全部候选结节,将采用基于 Tversky相似系数的损失函数,并选取超参数0.1进行后续的实验。
RU-Net 候选结节分割网络检测性能对比实验对所提出的 RU-Net 网络结构与 ResUNet网络结构以及原始 U-Net 网络结构进行对比实验,验证 RU-Net 网络在候选结节分割方面的性能。实验分别对比了原始 U-Net 网络、U-Net 网络中仅添加残差块的ResUNet网络、U-Net 网络中同时添加残差块和残差跳跃连接的 RU-Net 网络三种结构,同时对这三种结构分别设置基于 Dice 相似系数的损失函数和基于 Tversky相似系数的损失函数进行对比。针对候选结节分割模型的性能对比实验,共设置了六组不同模型进行比较,分别对比了网络的改进结构和损失函数,具体结果如表 3-3 所示。
技术文章|早期肺结核检测
文章图片

表3-3 候选结节分割模型性能比较
Table3-3 Performance comparison of candidate nodule segmentation models
表3-3 候选结节分割模型性能比较
Table3-3 Performance comparison of candidate nodule segmentation models
实验结果表明,所提出的 RU-Net 网络结构在采用不同的损失函数时,均可获得最优的分割精度、检测敏感度和特异度。采用 Dice 损失函数可以获得 0.7659 的最优分割精确度和最优特异度。本文采用的 Tversky 损失函数相比 Dice 损失函数,在牺牲较少检测精确度的情况下大幅度提升模型的检测敏感度,最终达到了 95.21%的最优检测敏感度,可以检测出更多的候选结节,尽可能防止漏诊。在算法效率方面,实验对比了六组模型在检测单张 CT 图像所需的平均时间,随着网络层数的加深,检测时间也会相应增加,但二维网络结构在检测的时间效率方面远远优于三维网络结构。综合比较以上几种网络结构,为尽可能多的检测到全部候选结节降低漏诊率,本章所提基于 Tversky损失函数的 RU-Net 网络结构获得了最优检测敏感度和较好的 Dice 系数,在候选结节分割任务上相对优于其他网络模型。
不同候选结节分割模型性能对比实验将本章所提出的基于 Tversky损失函数的 RU-Net 候选结节分割网络与其他方法相同阶段的检测性能进行对比,均采用 LUNA16 数据集进行实验。将本章所提 RU-Net 网络分别与基于 3D CNN 的网络结构,改进的 Faster R-CNN网络结构,基于 U-Net 的网络结构以及改进的 U-Net 网络结构等方法进行对比。采用 Dice 系数和敏感度对模型评估比较,结果如表 3-4 所示。
技术文章|早期肺结核检测
文章图片

表3-4 不同候选结节分割模型性能对比
Table3-4 Performance comparison of different candidate nodule segmentation models
从表中可以得出,采用基于 U-Net 网络结构的方法对比其他方法可以获得较好的检测敏感度,本章的 RU-Net 网络获得了 0.7344 的最佳 Dice 系数以及 95.21%的最佳检测敏感度,相比较其他不同候选结节分割模型,在分割精度和分割敏感度上均取得了相对较好的分割性能。图 3-9 显示了本章所提出的 RU-Net 候选结节分割网络的分割结果,其中第一行为输入的原始肺部 CT 图像,第二行为通过 RU-Net 候选结节分割网络所分割结节的掩模图,第三行为在肺部 CT 图像上标注出的候选结节位置图。通过分割结果图可以看出,本章方法较为准确的获得了候选结节的位置和大小信息。
技术文章|早期肺结核检测
文章图片

假阳性减少网络性能对比实验实验对比了本章所提 3D CNN 假阳性减少网络与其他不同假阳性减少网络之间的检测性能。包括 Liao 等人[18]提出的 3D CNN 网络;DeepLung[19]设计的深度 3D DPN 分类网络;Xie 等人[26]提出大大节省了时间和空间利用效率的 Boosting 分类方法;Gong等人[21]提出的基于 3D SE-ResNet模块的 3D DCNNs网络,性能对比如表 3-5 所示。
表3-5 不同假阳性减少网络性能对比
Table3-5 Comparison of the performance of different false positives reduce network
技术文章|早期肺结核检测
文章图片

表3-5 不同假阳性减少网络性能对比
Table3-5 Comparison of the performance of different false positives reduce network
从表中可以得出,本章所提出的 3D CNN 假阳性减少网络取得了最佳的分类效果,在准确率和敏感度上明显高于其他四种模型,分别获得了 96.79%的准确率和 96.19%的敏感度,对比不同假阳性减少网络获得相对较好的表现,可以有效降低检测中的假阳性。
4 结论 肺癌是目前常见的致死率较高的疾病之一,由于大部分肺癌患者在中晚期才能被确诊,或者已经成为转移性疾病,无法得到有效治疗导致较高的致死率。因此,早期诊断肺癌对于其临床治疗具有重要意义,可以有效提高患者的生存率,其中对其早期表现为肺结节形式的病灶进行检测至关重要。随着医学成像技术的不断发展,放射科医生仅凭肉眼对肺部 CT 图像进行分析工作量较大,且诊断需要较为丰富的经验知识,易造成漏诊和误诊。为提升检测效率和准确率,利用计算机辅助诊断系统可以辅助医生的工作,进一步减轻医生压力。本文首先介绍了肺结节检测模型与算法的研究背景与意义,并从传统的机器学习方法和深度学习方法两方面介绍目前国内外研究发展现状;其次简要介绍了针对肺结节检测模型与算法的相关理论知识;最后重点介绍了所提肺结节检测模型与算法的主要内容以及实验结果,具体研究工作包括基于残差 U-Net 的肺结节检测模型与算法为提高对肺结节的检测精确度和敏感度,提出了基于残差 U-Net 的肺结节检测模型与算法。首先对实验所采用的 LUNA16 数据集进行数据预处理并分割肺实质部分;在候选结节检测阶段提出 RU-Net 候选结节分割网络,该网络模型获得的 Dice 系数为 0.7344,检测敏感度为 95.21%;在假阳性减少阶段提出了 3D CNN 分类网络,提取更具代表性的图像特征进一步分类结节和非结节,该网络模型获得了 96.79%的平均准确率和96.19%的平均敏感度。同时在 LUNA16 数据集上与目前优秀的算法进行对比,本方法优于其他肺结节检测系统的性能。
参 考 文 献 [1] Siegel R L, Miller K D, Jemal A. Cancer statistics, 2020[J]. Ca A Cancer Journal forClinicians, 2020, 70(1).
[2] Jacobs C, Van Rikxoort E M, Scholten E T, et al. Solid, part-solid, or non-solid?:classification of pulmonary nodules in low-dose chest computed tomography by acomputer-aided diagnosis system[J]. Investigative Radiology, 2015, 50(3): 168-73.
[3] 王婧璇, 林岚, 赵思远, et al. 基于深度学习的肺结节计算机断层扫描影像检测与分类的研究进展[J]. 生物医学工程学杂志, 2019, 36(04): 670-676.
[4] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436.
[5] Han F, Wang H, Zhang G, et al. Texture Feature Analysis for Computer-Aided Diagnosison Pulmonary Nodules[J]. Journal of Digital Imaging, 2015, 28(1): 99-115.
[6] Orozco H M, Villegas O O V, Sánchez V G C, et al. Automated system for lung nodulesclassification based on wavelet feature descriptor and support vector machine[J]. BiomedicalEngineering Online, 2015, 14(1): 9.
[7] Chauhan D, Jaiswal V. An efficient data mining classification approach for detecting lungcancer disease[C]. International Conference on Communication & Electronics Systems, 2017.
[8] Naqi S M, Sharif M, Lali I U. A 3D nodule candidate detection method supported byhybrid features to reduce false positives in lung nodule detection[J]. Multimedia Tools andApplications, 2019, 78(18).
[9] Aria P, Sardar H, Nicholas P, et al. 3-D Convolutional Neural Networks for AutomaticDetection of Pulmonary Nodules in Chest CT[J]. IEEE journal of biomedical and healthinformatics, 2019, 23(5): 2080-2090.
[10] Gu J, Wang Z, Kuen J, et al. Recent Advances in Convolutional Neural Networks[J].Pattern Recognition, 2015.
[11] Sun W, Zheng B, Qian W. Automatic Feature Learning Using Multichannel ROI Basedon Deep Structured Algorithms for Computerized Lung Cancer Diagnosis[J]. Computers inBiology & Medicine: S0010482517300926.
[12] Gu Y, Lu X, Yang L, et al. Automatic lung nodule detection using a 3D deepconvolutional neural network combined with a multi-scale prediction strategy in chest CTs[J].Computers in Biology and Medicine.
[13] Kim B-C, Yoon J S, Choi J-S, et al. Multi-scale gradual integration CNN for falsepositive reduction in pulmonary nodule detection[J]. Neural Networks, 2019, 115.
[14] Qin, Wang, Fengyi, et al. Lung Nodule Detection in CT Images Using a RawPatch-Based Convolutional Neural Network[J]. Journal of digital imaging, 2019.
[15] Shelhamer E, Long J, Darrell T. Fully Convolutional Networks for SemanticSegmentation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 39(4):640-651.
[16] Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for BiomedicalImage Segmentation[C]. International Conference on Medical Image Computing &Computer-assisted Intervention, 2015: 234-241.
欢迎大家加我微信交流讨论(请备注csdn上添加)
技术文章|早期肺结核检测
文章图片

    推荐阅读