Feasibility of opportunistic osteoporosis screening using an artificial intelligence-based bone density measurement on chest CT scans
-
摘要:
探讨基于胸部CT的人工智能(AI)骨密度测量系统机会性筛查骨质疏松症的可行性。回顾性分析于我科2023年8月至2024年7月同时行双光能X线吸收测定法(DXA)和胸部CT的462名患者的资料,其中绝经后的女性317例、50岁以上的男性145例。比较两种方法测量骨密度之间的差异;以DXA测量的T值为参考标准,分析基于胸部CT的AI系统与DXA测量结果的一致性和相关性。绝经后女性和50岁以上男性的身高、体重、DXA T值及AI BMD有统计学差异;AI测量的BMD与DXA T值之间的相关系数为0.767;二者的κ值为0.697;AI诊断骨质疏松的ROC曲线下面积为0.941(95%CI 0.914~0.968),敏感性85.71%,特异性93.84%。AI骨密度测量系统与DXA测定骨密度具有高度相关性及良好一致性,可以帮助机会性筛查骨质疏松症。
Abstract:This study explores the feasibility of opportunistic osteoporosis screening using an artificial intelligence (AI)-based bone mineral density (BMD) measurement system on chest computed tomography (CT) scans. A retrospective analysis was conducted on 462 patients who underwent both dual-energy X-ray absorptiometry (DXA) and chest CT in our department between August 2023 and July 2024. The cohort included 317 postmenopausal women and 145 men aged > 50 years. BMD measurements from the AI system and DXA were compared. Using the T-value measured by DXA as the reference standard, the consistency and correlation between AI-based and DXA-measured BMD were analyzed. Significant differences in height, weight, DXA T-value, and AI-derived BMD were observed between men aged > 50 years and postmenopausal women. The AI-derived BMD showed a correlation coefficient of 0.767 with DXA T-values and a κ value of 0.697. The area under the ROC curve for AI-based diagnosis of osteoporosis was 0.941(95% CI 0.914–0.968), with a sensitivity of 85.71% and a specificity of 93.84%. The AI-based BMD measurement system demonstrates strong correlation and good agreement with DXA, supporting its feasibility for opportunistic osteoporosis screening.
-
Keywords:
- CT /
- Artificial intelligence /
- Bone density /
- osteoporosis
-
骨质疏松症是最常见的骨病,其特点是骨量减低、骨微结构破坏,可导致严重的并发症—骨质疏松性骨折。骨质疏松性骨折可提高短期死亡率和长期致残率,并严重影响患者的生活质量[1]。近期中国的一项全国多中心调查显示,从2020年到2050年,男性骨质疏松症的标准化患病率将从5.33%上升到7.46%;女性患者将从26.10%上升到39.19%[2]。骨质疏松症还会带来巨大的社会经济负担,预计到2050年,中国骨质疏松性骨折的患者将增加到约600万,每年将花费254亿美元[3]。因此,骨质疏松症的早期诊断和及时治疗至关重要。
双能X射线吸收测定法(dual-energy X-ray absorptiometry,DXA)是测量骨矿物质密度(bone mineral density,BMD)的金标准,结果以T值或Z值表示,DXA具有低辐射剂量和低成本的优点,但操作需要耗费大量时间和人力成本,并且DXA的诊断价值仅限于评价骨密度情况。胸部CT常用于肺癌早期筛查、冠状动脉疾病或者其他胸部疾病的诊断[4-5],其中许多疾病可以用人工智能(artificial intelligence,AI)进行评估,包括近期逐渐受到关注的BMD测量[6]。利用AI在胸部CT的基础上对多种情况进行综合评估,可以改善工作流程,降低医疗成本,有助于指导患者管理。目前对于AI骨密度测量系统诊断骨质疏松症的文章较少[7],本文旨在以DXA为诊断标准评估AI骨密度测量在日常实践中对于机会性筛查骨质疏松症是否有用和可靠。
1. 资料与方法
1.1 一般资料
以2023年8月至2024年7月在首都医科大学附属北京中医医院进行骨密度检查的患者462例作为本次研究对象,年龄50~91岁,平均年龄为64.9±8.5岁。纳入标准:①绝经后的女性及50岁以上的男性患者或健康体检者;②胸部CT检查时间与DXA检查时间间隔1个月之内。排除标准:①胸腰椎压缩骨折、感染或肿瘤;②胸腰椎手术史;③严重的脊柱畸形。遵循《赫尔辛基宣言》,本研究经过我院伦理委员会批准同意,免除受试者知情同意。
1.2 DXA骨密度测量
DXA设备为上海电气KD-GRAND骨密度仪。测量范围包括腰椎(L1-L4椎体)和双侧髋关节。基于腰椎和双侧股骨颈的最低T值(由绝经后的女性及50岁以上的男性与20~30岁成年人群的标准骨密度进行比较得到)进行骨质疏松和骨量减少的诊断。根据WHO推荐的诊断标准[8],T值≥−1SD为骨量正常、−1.0SD~−2.5SD为骨量减少、T值≤−2.5SD为骨质疏松。
1.3 CT图像采集
CT扫描设备为联影160层uCT780或Philips128层微平板Core CT,受检者采取仰卧位,双手上举,吸气后屏住呼吸进行扫描,扫描范围为胸廓入口到较低肋膈角下2~3 cm。扫描参数:管电压120 kV,采用自动管电流技术,层厚1 mm,矩阵512×512,DFOV 32~35 cm。采用迭代算法重建中等等级。
1.4 AI骨密度测量
将胸部CT扫描得到的1 mm层厚肺窗图像导入联影uAI-Discover PLBMD(版本号:R001)骨密度智能分析系统。基于深度学习及机器学习算法,计算出T7-T9椎体的平均BMD。根据Budoff与Lenchik等[9]研究推荐的分级标准,BMD绝对值≥136 mg/cm3为骨量正常、90~136 mg/cm3为骨量减少、≤90 mg/cm3为骨质疏松。
1.5 统计学方法
使用SPSS27.0和medcalc软件进行统计学分析。①连续变量的数据以均值±标准差表示,数据服从正态分布时,用独立样本t检验比较计量资料;不服从正态分布时用Mann-Whitney U检验。②计算Pearson相关系数r,检验AI计算的平均骨密度值和DXA测量的最小T值之间的关系。③加权κ值用于评估AI与DXA测量骨密度结果的一致性。κ=0.81~1.0、0.61~0.80、0.41~0.60、0.21~0.40和≤0.20,分别代表优、良、中、一般、差[10]。④以DXA测得的T值是否小于-2.5 SD作为骨质疏松的诊断标准,绘制受试者工作特征(ROC)曲线,并计算曲线下面积(area under the curve,AUC)对AI诊断骨质疏松的效能进行评估。⑤P值 < 0.05被认为有统计学意义。
2. 结果
2.1 一般情况
462名受试者中女性317人,男性145人,两组之间年龄和BMI无统计学差异,身高、体重、DXA T值及AI BMD有统计学差异(P值 < 0.05)(表1)。
表 1 462名受试者基本资料Table 1. Demographic data from 462 subjects变量 全部(n=462) 女性(n=317) 男性(n=145) P值 年龄(岁) 64.94±8.547 64.99±8.221 64.81±9.249 0.837 身高(cm) 162.98±7.278 159.35±4.855 170.90±5.065 <0.001 体重(kg) 65.91±11.065 62.52±9.609 73.34±10.412 <0.001 BMI(kg/m2) 24.75±3.385 24.60±3.492 25.08±3.125 0.160 DXA T值 −1.79±0.855 −1.98±0.839 −1.36±0.726 <0.001 AI BMD(mg/cm3) 111.33±33.522 106.66±32.886 121.53±32.732 <0.001 2.2 AI测量BMD与DXA测量T值相关分析
Pearson相关分析结果显示,AI测量的BMD与DXA T值之间有较强相关性(r=0.767,R2=0.588,P<0.001),根据性别进行亚组分析,女性组(r=0.776,R2=0.602,P<0.001),男性组(r=0.716,R2=0.512,P<0.001)。DXA T值(x轴)对AI BMD(y轴)的最佳拟合线:y=30.086 x+165.15,女性和男性亚组分别为y =30.407 x+166.98和y=32.253 x+165.48(图1)。
2.3 AI和DXA结果对比
本组研究中,DXA显示22.7%的患者骨质疏松,57.6%的患者骨量减少,19.7%的患者骨密度正常,而AI显示23.8%的患者骨质疏松,57.1%的患者骨量减少,19.0%的患者骨密度正常。381例(82.5%)患者诊断一致,其余81例(17.5%)诊断不一致患者中,轻度不一致80例(17.3%),重度不一致1例(0.2%)。21例(4.5%)经AI诊断为骨质疏松,但经DXA诊断为骨量减少或骨密度正常,16例(3.5%)经DXA诊断为骨质疏松,但AI诊断为骨量减少(表2)。κ值=0.697,P<0.001。
表 2 DXA和AI诊断类型的分布Table 2. Distributions of DXA and AI diagnostic typesAI 骨量正常 骨量减少 骨质疏松 总计 DXA 骨量正常 67(14.5%) 23(5.0%)a 1(0.2%)b 91(19.7%) 骨量减少 21(4.5%)a 225(48.7%) 20(4.3%)a 266(57.6%) 骨质疏松 0(0%)b 16(3.5%)a 89(19.3%) 105(22.7%) 总计 88(19.0%) 264(57.1%) 110(23.8%) 462(100%) 注:黑体字为一致;a为轻度不一致:一种方法显示骨密度正常,而另一种则显示骨量减少或一种方法显示骨量减少,而另一种则显示骨质疏松;b为重度不一致:一种方法显示骨密度正常,而另一种则显示骨质疏松。 2.4 AI诊断骨质疏松的效能
以DXA结果为诊断标准,AI诊断骨质疏松的ROC曲线见图2。AUC=0.941(95%CI 0.914~0.968),敏感性85.71%,特异性93.84%。
3. 讨论
随着人口预期寿命的延长,骨质疏松症逐渐成为日益严峻的公共卫生问题。早期诊断和干预骨质疏松症有可能显著提高患者的生活质量[11],因此,进行骨质疏松症的筛查尤为重要。
本组研究病例中男性组和女性组的年龄和BMI无统计学差异,但女性组DXA T值和AI BMD明显低于男性组。绝经后女性的骨密度通常低于50岁以上的男性,这一现象的原因主要在于老年女性激素水平的变化。众所周知,雌激素和睾酮在骨稳态中起重要作用[12],雌激素对骨形成和骨吸收的抑制有积极作用,而雄激素类固醇则有助于促进骨形成[13]。相较于男性,女性体内雄激素含量低,且在绝经后雌激素水平显著下降,使绝经后女性更易患骨质疏松症及骨质疏松性骨折。提示老年女性应特别关注自身的骨密度状况。
本研究评估了基于胸部CT的AI骨密度测量系统测量的骨密度,由于缺乏AI BMD与DXA T值分布比较的循证数据,我们对两者进行了线性相关分析,结果表明,AI测量骨密度与传统DXA扫描的骨密度T值有高度相关性(r=0.767)。有研究[14]显示胸部CT的CT值与DXA测得的骨密度有良好的相关性,对于骨质疏松症和低骨量有很高的诊断价值;Savage等[15]也发现基于胸部CT的AI计算出胸椎的CT值与传统DXA扫描的骨密度T值具有中度相关性,并且AI可以区分骨骼的健康状态;本研究中AI无体模骨密度测量基于深度学习及机器学习算法,以自身组织的CT值作为对照来进行BMD的计算,与[13][14]研究结果相契合。
本研究显示AI与DXA 检查结果有良好的一致性(κ值=0.697),并且AI对于骨质疏松的诊断率高于DXA。这可能源于两种方法在成像原理上的不同,DXA是二维成像技术,当患者存在脊柱退行性改变、腹主动脉钙化或其他硬化性病变时,DXA可能会高估BMD(g/cm2)[17-18];而AI通过计算单位体积内的CT值,并通过线性函数将其映射为BMD值(mg/cm3),可以视为基于三维成像对骨小梁的BMD进行量化,从而避免了皮质骨干扰的问题,这可能是AI对骨质疏松的检出率略高于DXA的原因之一。另外,随着年龄的增长,椎体骨髓中的脂肪含量逐渐增加,可能会导致在老年人中使用CT测量骨密度时出现骨密度偏低的情况[19]。本研究中,DXA检查采集了腰椎和股骨颈的数据,这两个部位是DXA测定骨密度最常用的部位,较单独以腰椎骨密度作为诊断结果更加准确。AI测量的椎体范围为T7~T9,一方面因为常规胸部CT采集范围均包含T7~T9,无需增加扫描视野或额外辐射剂量;另一方面,先前的研究[20]表明,胸椎与腰椎的骨密度具有良好的相关性,并且胸椎能提供更可靠的骨密度测量。由于胸椎骨密度较腰椎高10%~20%[21],我们采用了Budoff与Lenchik等[9]的研究结果作为骨量减少和骨质疏松的判定标准,以避免对骨质疏松的低估。
本研究结果显示基于胸部CT的AI骨密度分析系统对于骨质疏松症有较高的诊断效能。日常医疗实践中,众多患者由于各种原因进行胸部CT扫描,其图像中包含了尚未被普遍关注的骨密度信息。目前,AI在胸部影像诊断领域的应用已达到相当成熟的水平,比如在分析和评估肺癌、慢性阻塞性肺疾病等方面,同时,利用AI还能对骨质疏松进行评估,在不额外增加辐射剂量和患者经济负担的情况下,预测骨质疏松症的发生。本研究采用的AI模型同样适用于低剂量CT,能够在为体检患者筛查肺结节的同时评估骨密度情况,既避免了过度检查,又帮助了骨质疏松症的及时诊断,因此,AI骨密度分析系统是一种值得推广的诊断工具。
综上所述,AI模型能够提供与DXA高度相关的骨密度测量结果,灵敏性和特异性高,这有助于患者因其他适应症接受胸部CT检查时,通过AI进行机会性测量BMD,识别出可以从诊断性检查中获益的潜在患者,从而助力骨质疏松症的早期发现和管理。
-
表 1 462名受试者基本资料
Table 1 Demographic data from 462 subjects
变量 全部(n=462) 女性(n=317) 男性(n=145) P值 年龄(岁) 64.94±8.547 64.99±8.221 64.81±9.249 0.837 身高(cm) 162.98±7.278 159.35±4.855 170.90±5.065 <0.001 体重(kg) 65.91±11.065 62.52±9.609 73.34±10.412 <0.001 BMI(kg/m2) 24.75±3.385 24.60±3.492 25.08±3.125 0.160 DXA T值 −1.79±0.855 −1.98±0.839 −1.36±0.726 <0.001 AI BMD(mg/cm3) 111.33±33.522 106.66±32.886 121.53±32.732 <0.001 表 2 DXA和AI诊断类型的分布
Table 2 Distributions of DXA and AI diagnostic types
AI 骨量正常 骨量减少 骨质疏松 总计 DXA 骨量正常 67(14.5%) 23(5.0%)a 1(0.2%)b 91(19.7%) 骨量减少 21(4.5%)a 225(48.7%) 20(4.3%)a 266(57.6%) 骨质疏松 0(0%)b 16(3.5%)a 89(19.3%) 105(22.7%) 总计 88(19.0%) 264(57.1%) 110(23.8%) 462(100%) 注:黑体字为一致;a为轻度不一致:一种方法显示骨密度正常,而另一种则显示骨量减少或一种方法显示骨量减少,而另一种则显示骨质疏松;b为重度不一致:一种方法显示骨密度正常,而另一种则显示骨质疏松。 -
[1] LIU F, ZHU H, MA J, et al. Performance of iCare quantitative computed tomography in bone mineral density assessment of the hip and vertebral bodies in European spine phantom[J]. Journal of Orthopaedic Surgery and Research, 2023, 18(1): 777. DOI: 10.1186/s13018-023-04174-w.
[2] CUI Z, MENG X, FENG H, et al. Estimation and projection about the standardized prevalence of osteoporosis in mainland China[J]. Archives of Osteoporosis, 2019, 15(1): 2. DOI: 10.1007/s11657-019-0670-6.
[3] SI L, WINZENBERG T M, JIANG Q, et al. Projection of osteoporosis-related fractures and costs in China: 2010-2050[J]. Osteoporosis International, 2015, 26(7): 1929-1937. DOI: 10.1007/s00198-015-3093-2.
[4] DE MARGERIE-MELLON C, CHASSAGNON G. Artificial intelligence: A critical review of applications for lung nodule and lung cancer[J]. Diagnostic and Interventional Imaging, 2023, 104(1): 11-17. DOI: 10.1016/j.diii.2022.11.007.
[5] 孙安, 樊荣荣, 孙瑶, 等. CT重组算法对低剂量胸部CT筛查冠状动脉钙化积分准确性影响研究[J]. 临床放射学杂志, 2022, 41(5): 881-885. DOI: 10.13437/j.cnki.jcr.2022.05.025. SUN A, FAN R, SUN Y, et al. The effect of CT reconstruction kernel on the accuracy of low-dose chest CT screening for coronary artery calcification scores[J]. Journal of Clinical Radiology, 2022, 41(5): 881-885. DOI: 10.13437/j.cnki.jcr.2022.05.025.
[6] 赵宇, 张晓岚, 郑超, 等. 基于低剂量胸部CT深度学习模型自动测量骨密度研究[J]. 放射学实践, 2024, 39(2): 262-266. DOI: 10.13609/j.cnki.1000-0313.2024.02.019. ZHAO Y, ZHANG X L, ZHENG C, et al. Bone densitometry measurement based on low-dose chest CT with deep learning model[J]. Radiol Practice, 2024, 39(2): 262-266. DOI: 10.13609/j.cnki.1000-0313.2024.02.019.
[7] 赵君禄, 刘斋, 韩康, 等. 基于定量CT的机会性骨质疏松诊断: 2种定量CT骨密度测量软件临床应用比较分析[J]. 河北医科大学学报, 2024, 45(1): 17-23. DOI: 10.3969/j.issn.1007-3205.2024.01.005. ZHAO J L, LIU Z, HAN K, et al. Computed tomography—based opportunistic osteoporosis diagnosis: A comparison of clinical applications of two quantitative CT softwares[J]. Journal of Hebei Medical University, 2024, 45(1): 17-23. DOI: 10.3969/j.issn.1007-3205.2024.01.005.
[8] SIRIS E S, ADLER R, BILEZIKIAN J, et al. The clinical diagnosis of osteoporosis: a position statement from the National Bone Health Alliance Working Group[J]. Osteoporosis International, 2014, 25(5): 1439-1443. DOI: 10.1007/s00198-014-2655-z.
[9] BUDOFF M J, HAMIRANI Y S, GAO Y L, et al. Measurement of thoracic bone mineral density with quantitative CT[J]. Radiology, 2010, 257(2): 434-440. DOI: 10.1148/radiol.10100132.
[10] KENDRICK J, FRANCIS R J, HASSAN G M, et al. Prognostic utility of RECIP 1.0 with manual and AI-based segmentations in biochemically recurrent prostate cancer from [(68)Ga]Ga-PSMA-11 PET images[J]. European Journal of Nuclear Medicine and Molecular Imaging, 2023, 50(13): 4077-4086. DOI: 10.1007/s00259-023-06382-2.
[11] GERETY E L, HOPPER M A, BEARCROFT P W. The reliability of measuring the density of the L1 vertebral body on CT imaging as a predictor of bone mineral density[J]. Clinical Radiology, 2017, 72(2): 177-179. DOI: 10.1016/j.crad.2016.09.022.
[12] YAN L, WANG X, YU T, et al. Characteristics of the gut microbiota and serum metabolites in postmenopausal women with reduced bone mineral density[J]. Frontiers in Cellular and Infection Microbiology, 2024, 14: 1367325. DOI: 10.3389/fcimb.2024.1367325.
[13] WU X, ZHANG M. Effects of androgen and progestin on the proliferation and differentiation of osteoblasts[J]. Experimental and Therapeutic Medicine, 2018, 16(6): 4722-4728. DOI: 10.3892/etm.2018.6772.
[14] KIM Y W, KIM J H, YOON S H, et al. Vertebral bone attenuation on low-dose chest CT: Quantitative volumetric analysis for bone fragility assessment[J]. Osteoporosis International, 2017, 28(1): 329-338. DOI: 10.1007/s00198-016-3724-2.
[15] SAVAGE R H, van ASSEN M, MARTIN S S, et al. Utilizing Artificial Intelligence to Determine Bone Mineral Density Via Chest Computed Tomography[J]. Journal of Thoracic Imaging, 2020, 35 Suppl 1: S35-S39. DOI: 10.1097/RTI.0000000000000484.
[16] LIN W, HE C, XIE F, et al. Quantitative CT screening improved lumbar BMD evaluation in older patients compared to dual-energy X-ray absorptiometry[J]. Bmc Geriatrics, 2023, 23(1): 231. DOI: 10.1186/s12877-023-03963-6.
[17] 王盟盟, 张磊, 周凤云, 等. 双层光谱CT、QCT及DXA在骨质疏松诊断中的精确性与效能比较[J]. CT理论与应用研究, 2024, 33(6): 717-724. DOI: 10.15953/j.ctta.2024.086. WANG M M, ZHANG L, ZHOU F Y, et al. Comparative Study of the Accuracies and Efficiencies of Dual-layer Spectral CT, QCT, and DXA for Osteoporosis Diagnosis[J]. CT Theory and Applications, 2024, 33(6): 717-724. DOI: 10.15953/j.ctta.2024.086.
[18] EBBESEN E N, THOMSEN J S, BECK-NIELSEN H, et al. Vertebral bone density evaluated by dual-energy X-ray absorptiometry and quantitative computed tomography in vitro[J]. Bone, 1998, 23(3): 283-290. DOI: 10.1016/s8756-3282(98)00091-x.
[19] WONG M, PAPA A, LANG T, et al. Validation of thoracic quantitative computed tomography as a method to measure bone mineral density[J]. Calcified Tissue International, 2005, 76(1): 7-10. DOI: 10.1007/s00223-004-0020-5.
[20] 张羽, 张宗军, 刘许慧, 等. 胸椎定量CT和腰椎双能X线吸收检测仪对绝经后女性骨质疏松症的诊断差异[J]. 放射学实践, 2022, 37(10): 1205-1210. DOI: 10.13609/j.cnki.1000-0313.2022.10.003. ZHANG Y, ZHANG Z J, LIU X H, et al. Diagnosis difference of thoracic spine quantitative CT and lumbar spine DXA for osteoporosis in postmenopausal women[J]. Radiol Practice, 2022, 37(10): 1205-1210. DOI: 10.13609/j.cnki.1000-0313.2022.10.003.