ISSN 1004-4140
CN 11-3017/P

探讨基于卷积神经网络对颅底骨折CT图像精准诊断的应用价值

黄冬云, 夏军, 林煜文, 陈家宽, 陈海斌

黄冬云, 夏军, 林煜文, 陈家宽, 陈海斌. 探讨基于卷积神经网络对颅底骨折CT图像精准诊断的应用价值[J]. CT理论与应用研究, 2021, 30(6): 769-776. DOI: 10.15953/j.1004-4140.2021.30.06.13
引用本文: 黄冬云, 夏军, 林煜文, 陈家宽, 陈海斌. 探讨基于卷积神经网络对颅底骨折CT图像精准诊断的应用价值[J]. CT理论与应用研究, 2021, 30(6): 769-776. DOI: 10.15953/j.1004-4140.2021.30.06.13
HUANG Dongyun, XIA Jun, LIN Yuwen, CHEN Jiakuan, CHEN Haibin. The Application Value of Accurate Diagnosis of CT Image of Skull Base Fractures based on Convolutional Neural Network[J]. CT Theory and Applications, 2021, 30(6): 769-776. DOI: 10.15953/j.1004-4140.2021.30.06.13
Citation: HUANG Dongyun, XIA Jun, LIN Yuwen, CHEN Jiakuan, CHEN Haibin. The Application Value of Accurate Diagnosis of CT Image of Skull Base Fractures based on Convolutional Neural Network[J]. CT Theory and Applications, 2021, 30(6): 769-776. DOI: 10.15953/j.1004-4140.2021.30.06.13

探讨基于卷积神经网络对颅底骨折CT图像精准诊断的应用价值

基金项目: 

深圳市龙岗区医疗卫生科技计划项目(基于RefineNet卷积神经网络对CT颅底骨折精准诊断的应用价值(LGKCYLWS2019000384))。

详细信息
    作者简介:

    黄冬云,男,影像医学与核医学在职硕士,深圳市龙岗区第二人民医院放射科主治医师,主要从事影像诊断方面工作,E-mail:huangdongyundd@163.com;夏军*,影像医学与核医学博士,深圳市第二人民放射科主任医师,主要研究领域为中枢神经系统,E-mail:xiajun@email.szu.edu.cn。

  • 中图分类号: R814;O242

The Application Value of Accurate Diagnosis of CT Image of Skull Base Fractures based on Convolutional Neural Network

  • 摘要: 目的:探讨卷积神经网络(CNN)在颅底骨折CT诊断的应用价值。方法:回顾性搜集3 100例颅底骨折患者及2 467例正常患者的颅骨CT图像数据,经纳排标准筛选,最终选用2 488例颅底骨折及1 628例正常患者的颅底CT图像数据。对CT图像进行骨折标注后,随机分配训练集和测试集后。通过CNN构建颅骨区域识别算法模型和颅骨骨折检测算法模型,随后在测试中以颅底骨折区域识别和头颅骨折、颅底骨折对模型进行验证,验证指标为精准率(precision)、召回率(recall)、平均诊断耗时;与人工组(低年资放射科医师)测试进行诊断效能对比。结果:通过CNN运算获得的稳定模型后进行测试对比,结果显示全颅底区域骨折、前、中、后颅底骨折精准度均<0.5,低于人工组(均>0.63);召回率>0.89,均优于人工组(均<0.8);平均诊断时间为(3.12±2.67)s,明显少于人工组诊断时间。分别在颅底骨折区域测试中,精准度率:前颅底>中颅底>后颅底,召回率:中颅底>后颅底>前颅底。结论:基于CNN颅底骨折算法模型对于颅脑外伤患者CT诊断颅底骨折在召回率、诊断耗时均优于人工测试结果,在辅助临床诊断、降低漏诊及诊断耗时方面具有一定的价值。
    Abstract: Objective: To explore the application value of convolutional neural network (CNN) in CT diagnosis of skull base fractures. Methods: The skull CT image data of 3100 patients with skull base fractures and 2 467 normal patients was collected retrospectively. After the standard nanofiltration and actual model calculation, the skull base CT image data of 2 488 patients with skull base fractures and 1 628 normal patients were selected. The CT images were labeled and randomly assigned into training set and test set. The skull area discrimination algorithm model and skull base fractures detection algorithm model were established by CNN, then we performed verification on the models through skull base area discrimination, skull fractures and skull base fractures in the test. The detection indexes included precision, recall and average diagnosis time consumption. We carried out comparisons of diagnostic efficacy with the artificial group (junior radiologist) test. Results: We carried out test comparisons on the steady models obtained by CNN algorithm, the results showed that the accuracy of the whole skull base fractures (including the anterior, middle and posterior skull base fractures) was less than 0.5, which was lower than that of the artificial group (all higher than 0.63); The recall rate > 0.89 was better than that of the artificial group (all < 0.8); The average diagnosis time was (3.12±67)s, significantly less than that of artificial group. In the area test of skull base fractures, the accuracy rate was anterior skull base > middle skull base > posterior skull base while the recall rate was middle skull base > posterior skull base > anterior skull base. Conclusion: The algorithm model of skull base fractures based on CNN is superior to the artificial test results in recall rate and diagnosis time consumption for CT diagnosis of skull base fractures in patients with craniocerebral trauma, which has certain value in assisting clinical diagnosis, reducing missed diagnosis and diagnosis time consumption.
  • 骨质疏松症是最常见的骨病,其特点是骨量减低、骨微结构破坏,可导致严重的并发症—骨质疏松性骨折。骨质疏松性骨折可提高短期死亡率和长期致残率,并严重影响患者的生活质量[1]。近期中国的一项全国多中心调查显示,从2020年到2050年,男性骨质疏松症的标准化患病率将从5.33%上升到7.46%;女性患者将从26.10%上升到39.19%[2]。骨质疏松症还会带来巨大的社会经济负担,预计到2050年,中国骨质疏松性骨折的患者将增加到约600万,每年将花费254亿美元[3]。因此,骨质疏松症的早期诊断和及时治疗至关重要。

    双能X射线吸收测定法(dual-energy X-ray absorptiometry,DXA)是测量骨矿物质密度(bone mineral density,BMD)的金标准,结果以T值或Z值表示,DXA具有低辐射剂量和低成本的优点,但操作需要耗费大量时间和人力成本,并且DXA的诊断价值仅限于评价骨密度情况。胸部CT常用于肺癌早期筛查、冠状动脉疾病或者其他胸部疾病的诊断[4-5],其中许多疾病可以用人工智能(artificial intelligence,AI)进行评估,包括近期逐渐受到关注的BMD测量[6]。利用AI在胸部CT的基础上对多种情况进行综合评估,可以改善工作流程,降低医疗成本,有助于指导患者管理。目前对于AI骨密度测量系统诊断骨质疏松症的文章较少[7],本文旨在以DXA为诊断标准评估AI骨密度测量在日常实践中对于机会性筛查骨质疏松症是否有用和可靠。

    以2023年8月至2024年7月在首都医科大学附属北京中医医院进行骨密度检查的患者462例作为本次研究对象,年龄50~91岁,平均年龄为64.9±8.5岁。纳入标准:①绝经后的女性及50岁以上的男性患者或健康体检者;②胸部CT检查时间与DXA检查时间间隔1个月之内。排除标准:①胸腰椎压缩骨折、感染或肿瘤;②胸腰椎手术史;③严重的脊柱畸形。遵循《赫尔辛基宣言》,本研究经过我院伦理委员会批准同意,免除受试者知情同意。

    DXA设备为上海电气KD-GRAND骨密度仪。测量范围包括腰椎(L1-L4椎体)和双侧髋关节。基于腰椎和双侧股骨颈的最低T值(由绝经后的女性及50岁以上的男性与20~30岁成年人群的标准骨密度进行比较得到)进行骨质疏松和骨量减少的诊断。根据WHO推荐的诊断标准[8],T值≥−1SD为骨量正常、−1.0SD~−2.5SD为骨量减少、T值≤−2.5SD为骨质疏松。

    CT扫描设备为联影160层uCT780或Philips128层微平板Core CT,受检者采取仰卧位,双手上举,吸气后屏住呼吸进行扫描,扫描范围为胸廓入口到较低肋膈角下2~3 cm。扫描参数:管电压120 kV,采用自动管电流技术,层厚1 mm,矩阵512×512,DFOV 32~35 cm。采用迭代算法重建中等等级。

    将胸部CT扫描得到的1 mm层厚肺窗图像导入联影uAI-Discover PLBMD(版本号:R001)骨密度智能分析系统。基于深度学习及机器学习算法,计算出T7-T9椎体的平均BMD。根据Budoff与Lenchik等[9]研究推荐的分级标准,BMD绝对值≥136 mg/cm3为骨量正常、90~136 mg/cm3为骨量减少、≤90 mg/cm3为骨质疏松。

    使用SPSS27.0和medcalc软件进行统计学分析。①连续变量的数据以均值±标准差表示,数据服从正态分布时,用独立样本t检验比较计量资料;不服从正态分布时用Mann-Whitney U检验。②计算Pearson相关系数r,检验AI计算的平均骨密度值和DXA测量的最小T值之间的关系。③加权κ值用于评估AI与DXA测量骨密度结果的一致性。κ=0.81~1.0、0.61~0.80、0.41~0.60、0.21~0.40和≤0.20,分别代表优、良、中、一般、差[10]。④以DXA测得的T值是否小于-2.5 SD作为骨质疏松的诊断标准,绘制受试者工作特征(ROC)曲线,并计算曲线下面积(area under the curve,AUC)对AI诊断骨质疏松的效能进行评估。⑤P值 < 0.05被认为有统计学意义。

    462名受试者中女性317人,男性145人,两组之间年龄和BMI无统计学差异,身高、体重、DXA T值及AI BMD有统计学差异(P值 < 0.05)(表1)。

    表  1  462名受试者基本资料
    Table  1.  Demographic data from 462 subjects
    变量 全部(n=462) 女性(n=317) 男性(n=145) P
    年龄(岁) 64.94±8.547 64.99±8.221 64.81±9.249 0.837
    身高(cm) 162.98±7.278 159.35±4.855 170.90±5.065 <0.001
    体重(kg) 65.91±11.065 62.52±9.609 73.34±10.412 <0.001
    BMI(kg/m2 24.75±3.385 24.60±3.492 25.08±3.125 0.160
    DXA T值 −1.79±0.855 −1.98±0.839 −1.36±0.726 <0.001
    AI BMD(mg/cm3 111.33±33.522 106.66±32.886 121.53±32.732 <0.001
    下载: 导出CSV 
    | 显示表格

    Pearson相关分析结果显示,AI测量的BMD与DXA T值之间有较强相关性(r=0.767,R2=0.588,P<0.001),根据性别进行亚组分析,女性组(r=0.776,R2=0.602,P<0.001),男性组(r=0.716,R2=0.512,P<0.001)。DXA T值(x轴)对AI BMD(y轴)的最佳拟合线:y=30.086 x+165.15,女性和男性亚组分别为y =30.407 x+166.98和y=32.253 x+165.48(图1)。

    图  1  AI测量BMD与DXA测量T值的相关性散点图
    Figure  1.  Scatter plot of correlation between BMD measured by AI and T value measured by DXA

    本组研究中,DXA显示22.7%的患者骨质疏松,57.6%的患者骨量减少,19.7%的患者骨密度正常,而AI显示23.8%的患者骨质疏松,57.1%的患者骨量减少,19.0%的患者骨密度正常。381例(82.5%)患者诊断一致,其余81例(17.5%)诊断不一致患者中,轻度不一致80例(17.3%),重度不一致1例(0.2%)。21例(4.5%)经AI诊断为骨质疏松,但经DXA诊断为骨量减少或骨密度正常,16例(3.5%)经DXA诊断为骨质疏松,但AI诊断为骨量减少(表2)。κ值=0.697,P<0.001。

    表  2  DXA和AI诊断类型的分布
    Table  2.  Distributions of DXA and AI diagnostic types
    AI
    骨量正常 骨量减少 骨质疏松 总计
    DXA 骨量正常 67(14.5%) 23(5.0%)a 1(0.2%)b 91(19.7%)
    骨量减少 21(4.5%)a 225(48.7%) 20(4.3%)a 266(57.6%)
    骨质疏松 0(0%)b 16(3.5%)a 89(19.3%) 105(22.7%)
    总计   88(19.0%) 264(57.1%) 110(23.8%) 462(100%)
    注:黑体字为一致;a为轻度不一致:一种方法显示骨密度正常,而另一种则显示骨量减少或一种方法显示骨量减少,而另一种则显示骨质疏松;b为重度不一致:一种方法显示骨密度正常,而另一种则显示骨质疏松。
    下载: 导出CSV 
    | 显示表格

    以DXA结果为诊断标准,AI诊断骨质疏松的ROC曲线见图2。AUC=0.941(95%CI 0.914~0.968),敏感性85.71%,特异性93.84%。

    图  2  AI诊断骨质疏松症的ROC曲线
    Figure  2.  ROC curve of AI diagnosis of osteoporosis

    随着人口预期寿命的延长,骨质疏松症逐渐成为日益严峻的公共卫生问题。早期诊断和干预骨质疏松症有可能显著提高患者的生活质量[11],因此,进行骨质疏松症的筛查尤为重要。

    本组研究病例中男性组和女性组的年龄和BMI无统计学差异,但女性组DXA T值和AI BMD明显低于男性组。绝经后女性的骨密度通常低于50岁以上的男性,这一现象的原因主要在于老年女性激素水平的变化。众所周知,雌激素和睾酮在骨稳态中起重要作用[12],雌激素对骨形成和骨吸收的抑制有积极作用,而雄激素类固醇则有助于促进骨形成[13]。相较于男性,女性体内雄激素含量低,且在绝经后雌激素水平显著下降,使绝经后女性更易患骨质疏松症及骨质疏松性骨折。提示老年女性应特别关注自身的骨密度状况。

    本研究评估了基于胸部CT的AI骨密度测量系统测量的骨密度,由于缺乏AI BMD与DXA T值分布比较的循证数据,我们对两者进行了线性相关分析,结果表明,AI测量骨密度与传统DXA扫描的骨密度T值有高度相关性(r=0.767)。有研究[14]显示胸部CT的CT值与DXA测得的骨密度有良好的相关性,对于骨质疏松症和低骨量有很高的诊断价值;Savage等[15]也发现基于胸部CT的AI计算出胸椎的CT值与传统DXA扫描的骨密度T值具有中度相关性,并且AI可以区分骨骼的健康状态;本研究中AI无体模骨密度测量基于深度学习及机器学习算法,以自身组织的CT值作为对照来进行BMD的计算,与[13][14]研究结果相契合。

    本研究显示AI与DXA 检查结果有良好的一致性(κ值=0.697),并且AI对于骨质疏松的诊断率高于DXA。这可能源于两种方法在成像原理上的不同,DXA是二维成像技术,当患者存在脊柱退行性改变、腹主动脉钙化或其他硬化性病变时,DXA可能会高估BMD(g/cm2[17-18];而AI通过计算单位体积内的CT值,并通过线性函数将其映射为BMD值(mg/cm3),可以视为基于三维成像对骨小梁的BMD进行量化,从而避免了皮质骨干扰的问题,这可能是AI对骨质疏松的检出率略高于DXA的原因之一。另外,随着年龄的增长,椎体骨髓中的脂肪含量逐渐增加,可能会导致在老年人中使用CT测量骨密度时出现骨密度偏低的情况[19]。本研究中,DXA检查采集了腰椎和股骨颈的数据,这两个部位是DXA测定骨密度最常用的部位,较单独以腰椎骨密度作为诊断结果更加准确。AI测量的椎体范围为T7~T9,一方面因为常规胸部CT采集范围均包含T7~T9,无需增加扫描视野或额外辐射剂量;另一方面,先前的研究[20]表明,胸椎与腰椎的骨密度具有良好的相关性,并且胸椎能提供更可靠的骨密度测量。由于胸椎骨密度较腰椎高10%~20%[21],我们采用了Budoff与Lenchik等[9]的研究结果作为骨量减少和骨质疏松的判定标准,以避免对骨质疏松的低估。

    本研究结果显示基于胸部CT的AI骨密度分析系统对于骨质疏松症有较高的诊断效能。日常医疗实践中,众多患者由于各种原因进行胸部CT扫描,其图像中包含了尚未被普遍关注的骨密度信息。目前,AI在胸部影像诊断领域的应用已达到相当成熟的水平,比如在分析和评估肺癌、慢性阻塞性肺疾病等方面,同时,利用AI还能对骨质疏松进行评估,在不额外增加辐射剂量和患者经济负担的情况下,预测骨质疏松症的发生。本研究采用的AI模型同样适用于低剂量CT,能够在为体检患者筛查肺结节的同时评估骨密度情况,既避免了过度检查,又帮助了骨质疏松症的及时诊断,因此,AI骨密度分析系统是一种值得推广的诊断工具。

    综上所述,AI模型能够提供与DXA高度相关的骨密度测量结果,灵敏性和特异性高,这有助于患者因其他适应症接受胸部CT检查时,通过AI进行机会性测量BMD,识别出可以从诊断性检查中获益的潜在患者,从而助力骨质疏松症的早期发现和管理。

  • [1] 朱捷, 田瑞霞, 黄振山. 1121例交通事故致颅脑损伤流行病学调查[J]. 安徽医学, 2012, 33(5):601-604.

    ZHU J, TIAN R X, HUANG Z S. Research of epidemiology of 1121 cases of craniocerebral traffic injuries[J]. Anhui Medical Journal, 2012, 33(5):601-604. (in Chinese).

    [2]

    Neurology T L. Traumatic brain injury:Time to end the silence[J]. Lancet Neurology, 2010, 9(4):331. DOI: 10.1016/S1474-4422(10)70069-7.

    [3]

    CIOMPI F, CHUNG K, van RIEL S J, et al. Towards automatic pulmonary nodule management in lung cancer screening with deep learning[J]. Scientific Reports, 2017, 7:46878. DOI:10. 1038/srep46878.

    [4]

    WANG H K, ZHOU Z W, LI Y C, et al. Comparison of machine learning methods for classifying mediastinal lymph node metastasis of non-small cell lung cancer from 18F-FDG PET/CT images[J]. European Journal of Nuclear Medicine and Molecular Imaging Research, 2017, 7(1):11. DOI: 10.1186/s13550-017-0260-9.

    [5]

    PAUL R, HAWKINS S H, BALAGURUNATHAN Y, et al. Deep feature transfer learning in combination with traditional features predicts survival among patients with lung adenocarcinoma[J]. Tomography, 2016, 2(4):388-395. DOI: 10.18383/j.tom.2016.00211.

    [6] 周清清, 王佳硕, 唐雯, 等. 基于卷积神经网络成人肋骨骨折CT自动检测和分类的应用研究[J]. 影像诊断与介入放射学, 2020, 29(1):27-31.

    ZHOU Q Q, WANG J S, TANG W, et al. Automatic detection of adult rib fractures on CT using convolutional neural network[J]. Diagnostic Imaging & Interventional Radiology, 2020, 29(1):27-31. (in Chinese).

    [7]

    YANG S, YIN B, CAO W, et al. Diagnostic accuracy of deep learning in orthopaedic fractures:A systematic review and meta-analysis[J]. Clinical Radiology, 2020, 75(9):713. e17-713.e28.

    [8]

    LI L H, SONG X F, GUO Y, et al. Deep convolutional neural networks for automatic detection of orbital blowout fractures[J]. The Journal of Craniofacial Surgery, 2020, 31(2):400-403.

    [9] 吴孟超, 吴在德. 黄家驷外科学[M]. 7版. 北京:人民卫生出版社, 2019:833-834.
    [10]

    MANSON P N, STANWIX M G, YAREMCHUK M J, et al. Frontobasal fractures:Anatomical classification and clinical significance[J]. Plastic Reconstructive Surgery, 2009, 124(6):2096-2106.

    [11]

    ZIU M, SAVAGE J G, JIMENEZ D F. Diagnosis and treatment of cerebrospinal fluid rhinorrhea following accidental traumatic anterior skull base fractures[J]. Neurosurgical Focus, 2012, 32(6):E3. DOI: 10.3171/2012.4.FOCUS1244.

    [12]

    DAUDIA A, BISWAS D, JONES N S. Risk of meningitis with cerebrospinal fluid rhinorrhea[J]. Annals of Otology Rhinology & Laryngology, 2007, 116(12):902-905.

    [13]

    JOHNSON F, SEMAAN M T, MEGERIAN C A. Temporal bone fracture:Evaluation and management in the modern era[J]. Otolaryngologic Clinics of North America, 2008, 41(3):597-618.

    [14]

    DAHIYA R, KELLER J D, LITOFSKY N S, et al. Temporal bone fractures:Otic capsule sparing versus otic capsule violating clinical and radiographic considerations[J]. The Journal of Trauma, 1999, 47(6):1079-1083. DOI:10.1097/00005373-199912000-00014. PMID:10608536.

    [15]

    LITTLE S C, KESSER B W. Radiographic classifification of temporal bone fractures:Clinical predictability using a new system[J]. Archives of Otolaryngology-Head & Neck Surgery, 2006, 132(12):1300-1304. DOI:10.1001/archotol.132.12.1300. PMID:17178939.

    [16]

    OCHALSKI P G, SPIRO R M, Fabio A, et al. Fractures of the clivus:A contemporary series in the computed tomography era[J]. Neurosurgery, 2009, 65(6):1063-1069.

    [17] 李文星, 陈森林, 程云, 等. 颅脑外伤急诊CT检查的误、漏诊分析[J]. 中国急救复苏与灾害医学杂志, 2012, 7(9):878-880.
计量
  • 文章访问数:  245
  • HTML全文浏览量:  10
  • PDF下载量:  19
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-05-29
  • 网络出版日期:  2021-11-03

目录

/

返回文章
返回
x 关闭 永久关闭