ISSN 1004-4140
CN 11-3017/P

基于波形特征向量的谱聚类地震相分析

秦德文, 张岩, 于杰

秦德文, 张岩, 于杰. 基于波形特征向量的谱聚类地震相分析[J]. CT理论与应用研究(中英文), 2024, 33(1): 13-23. DOI: 10.15953/j.ctta.2023.124.
引用本文: 秦德文, 张岩, 于杰. 基于波形特征向量的谱聚类地震相分析[J]. CT理论与应用研究(中英文), 2024, 33(1): 13-23. DOI: 10.15953/j.ctta.2023.124.
QIN D W, ZHANG Y, YU J. Seismic Facies Analysis Based on Spectral Clustering with Waveform Characteristic Vector[J]. CT Theory and Applications, 2024, 33(1): 13-23. DOI: 10.15953/j.ctta.2023.124. (in Chinese).
Citation: QIN D W, ZHANG Y, YU J. Seismic Facies Analysis Based on Spectral Clustering with Waveform Characteristic Vector[J]. CT Theory and Applications, 2024, 33(1): 13-23. DOI: 10.15953/j.ctta.2023.124. (in Chinese).

基于波形特征向量的谱聚类地震相分析

基金项目: “十四五”科技重大项目(中国近海新区新领域勘探技术(KJGG2022-0304))。
详细信息
    作者简介:

    秦德文: 男,硕士,中海石油(中国)有限公司上海分公司高级工程师,主要从事油藏地球物理方面研究工作,E-mail:qindw@cnooc.com.cn

    通讯作者:

    张岩: 男,硕士,中海石油(中国)有限公司上海分公司高级工程师,主要从事油气地球物理技术研究工作,E-mail:zhangyan65@cnooc.com.cn

  • 中图分类号: O  242;P  631.4;P  315

Seismic Facies Analysis Based on Spectral Clustering with Waveform Characteristic Vector

  • 摘要:

    本文提出一种基于地震沉积学原理沿层提取地震波形特征向量,并以谱聚类(spectral clustering)分析进行地震相划分的方法。谱聚类能够处理非线性的数据结构和高维数据的聚类问题,但其相似度矩阵的构建和谱分解的计算较为复杂,需要较高的计算资源和时间成本。为提高谱聚类算法的效率和可扩展性,本文提出将Mini-batch K-means算法与谱聚类算法结合起来的MKSC算法,在提高谱聚类算法精度的同时大大降低谱聚类空间的复杂度。经过对数值模拟、地球物理模型数据和实际地震资料的处理分析,证明该方法在沉积相划分、沉积相特征识别方面的效果明显,是一种具有良好应用前景的新型沉积特征分析工具。

    Abstract:

    Based on the principle of seismic sedimentology, the feature vectors of seismic waveforms are extracted along stratum slices, and spectral clustering analysis is introduced to classify seismic facies. Spectral clustering is an unsupervised machine learning algorithm. Its essence is to simplify the expression of high-dimensional seismic data in the form of feature vectors, which belongs to the process of dimensionality reduction. Considering the traces with specific time windows in the seismic work area as nodes of the graph and the similarity between traces as the weight of the edges, a graph model can be constructed. Spectral clustering must determine the best segmentation method to complete the segmentation of the graph, so that different types of sedimentary characteristics can be distinguished. Physical model and actual data processing and analysis demonstrate that this method is capable of dividing sedimentary facies characteristics and is a new kind of facies analysis tool for reservoir classification, which has good application prospects.

  • 肺癌(lung cancer)是全球癌症相关死亡的主要原因之一,也是中国最常见的恶性肿瘤之一,其死亡率约18.0%[1],居恶性肿瘤首位,5年总生存率仅约15%[2]。非小细胞肺癌(non-small cell lung cancer,NSCLC)为肺癌最常见的类型[3]。NSCLC早期的预后预测有助于提供额外治疗、密切随访,实现精准个体化治疗,以改善NSCLC患者的预后。

    目前,NSCLC预后的评估主要依靠肿瘤淋巴结转移(tumor node metastasis,TNM)分期系统,但肿瘤具有时空异质性,传统TNM分期系统以及组织病理学等有创检测并不能全面准确预测非小细胞肺癌患者的预后[4]。影像组学(radiomics)技术通过从医学图像中提取并分析高通量影像组学特征,能够将图像信息转换为反映肿瘤内部异质性的信息并进行深层预测,具有安全、无创、全面等优点[5]。近年来,不断有学者探索影像组学技术在非小细胞肺癌预后预测中的应用价值,且取得了长足的进展。

    本文就影像组学技术的基本研究流程及其在预测NSCLC预后应用方面的研究现状作综述。

    影像组学是指从医学影像图像中高通量提取大量特征并进行筛选降维,利用数据分析方法将数字图像信息转化为可挖掘的高维信息,构建预测模型,对肿瘤的深层信息进行描述,分析临床问题并提供决策指导[6]。影像组学的概念由荷兰学者Lambin等[7]在2012年提出,影像组学技术的出现使肺癌患者的早期诊断和个体化治疗成为可能,因此越来越受到科学家及临床工作者的重视。

    影像组学的研究流程主要分为图像采集、图像分割、特征提取、特征选择及模型建立5步[8]。目前NSCLC影像组学研究多回顾性收集图像数据,由于不同平台和不同参数下采集的图像存在差异,一般需预先对图像进行标准化及归一化处理[9-10]。由于尚无十分理想的全自动分割工具,目前多采用人工分割或半自动分割方法[11]。通过特定的计算机算法从图像感兴趣区域中自动提取大量的定量化影像组学特征,主要包括强度特征、纹理特征、形状特征及小波特征等[12]。对提取出的影像组学特征进行选择,以筛选出稳定且有效的特征。最后基于最终选择的特征建立影像组学模型对病灶进行预测。

    肺癌的预后与患者年龄、性别、吸烟状况、TNM分期、病理亚型等许多因素相关[13],但其大多属于定性因素,具有评估不准确等局限性。影像组学技术可以运用影像组学特征及临床信息对NSCLC预后进行量化分析以及预测。

    NSCLC的总生存期(overall survival,OS)、无病生存期(disease-free survival,DFS)、无进展生存期(progression-free survival,PFS)都反映了患者预后,但目前难以实现对NSCLC患者DFS、OS、PFS的准确预测。

    因此研究者试图寻找一种新的预测工具以更加准确全面地预测NSCLC的预后。

    Yang等[14]通过从239例NSCLC患者的CT图像中提取二维及三维影像组学特征并与临床预测指标相结合,构建影像组学列线图评估NSCLC患者的总生存期,研究显示影像组学特征与NSCLC患者总生存期具有明显的相关性,二维和三维联合影像组学特征比单一特征预测预后的效能更好,且影像组学特征与临床预测指标联合能更好地评估NSCLC患者的预后。Wang等[15]提取并分析局部晚期NSCLC患者的CT影像组学特征以及临床特征,建立联合影像组学、临床特征的预后预测模型以及多模态列线图,研究显示联合模型对总生存期的预测效能较单一模型更优,预测值与实际值的一致性更高。Yang等[16]从 315名NSCLC患者的CT和正电子发射计算机断层显像(positionemission tomography,PET)图像中提取影像组学特征,基于CT、PET和PET/CT影像组学特征,使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)Cox回归算法计算影像组学评分,联合影像组学评分及临床病理因素进行多变量Cox回归分析确定独立的危险因素,并构建列线图,结果表明影像组学评分及临床联合模型具有最佳的一致性指数(concordance index,C-index),该研究认为基于18F-FDG PET/CT影像组学列线图能较好地预测NSCLC患者的预后。Yoo等[17]纳入了300例 Ⅲ期NSCLC患者,分别提取原发肿瘤初始检查和新辅助同步放化疗后的影像组学特征,通过LASSO回归分析筛选有用特征,通过Cox比例风险回归分析评估LASSO评分和常规PET参数预后预测价值,研究表明LASSO评分显示出更好的OS预测效能。PET/CT的影像组学特征是评估 Ⅲ期 NSCLC总生存期的独立预后因素,基于影像组学特征建立的LASSO评分显示了比传统PET参数更好的个体化OS估计预后能力。

    前述研究显示影像组学在预测NSCLC患者总生存期中具有良好的效能,但均为回顾性研究,可能存在选择偏倚,且均未考虑基因组特征,而肿瘤的基因表型有可能影响患者的生存预后,相关研究有待进一步探索。

    Choe等[18]回顾性分析接受肺腺癌根治手术的患者,通过单变量和多变量Cox比例风险回归分析评估基于增强CT影像组学特征与患者无病生存期(DFS)和总生存期(OS)之间的相关性,结果显示影像组学特征与患者DFS和OS独立相关,影像组学与临床病理因素联合建立的模型对预后预测的效能更优,该研究表明CT影像组学可有效预测肺腺癌患者的预后,并能提供除临床病理危险因素之外的额外信息。Liu等[19]探索了基于不同感兴趣体积(region of volume,VOI)的影像组学对肺腺癌患者DFS预测准确性的影响,该研究分别基于大体肿瘤体积(gross tumor volume,GTV)、肿瘤边界外3 mm、跨越肿瘤边界6 mm、肿瘤边界外6 mm提取影像组学特征构建模型并比较模型的效能,研究发现基于跨越肿瘤边界6 mm VOI的影像组学模型预测肺腺癌患者DFS的效能最优。Park等[4]通过在不同层厚的CT图像中提取影像组学特征分别建立模型预测非小细胞肺癌患者DFS,模型训练集的一致性指数分别为0.68、0.70和0.68,其研究结果显示基于不同层厚建立的模型效能并没有明显差异,因此认为CT层厚对肺腺癌患者DFS的预测没有显著影响。Xiu等[20]分析146例非小细胞肺癌患者的CT影像组学、临床及肿瘤免疫特征分别构建模型,并联合组织病理学及免疫组化特征构建多模态列线图,比较各模型的准确性和差异。列线图模型在训练集和验证集的C-index分别为0.8766和0.8426,优于临床病理-影像组学模型、影像组学模型和临床病理模型。

    这些研究探索了影像组学在预测NSCLC患者无病生存期中的应用价值,但仍存在随访间隔及扫描参数不统一等问题,一定程度上影响了研究的可靠性和可重复性。

    He等[21]联合CT影像组学特征、临床病理风险因素构建个体化预后评分系统,预测接受铂类化疗的 Ⅳ期非小细胞肺癌患者的无进展生存期(PFS),研究发现该模型对患者PFS具有良好的预测效能,在95% 置信区间内其C-index为0.772,内部及外部验证集的C-index分别为0.738和0.750,且该联合模型在临床实用性方面显著优于基于临床病理学建立的模型,该研究显示基于CT影像组学特征和临床病理学风险因素的预后模型可用于IV期NSCLC铂类化疗患者PFS的个体化预测,以指导IV期NSCLC个体化预治疗。Li等[22]回顾性分析368例治疗前接受18F-FDG PET/CT检查的NSCLC患者,利用LIFEx软件提取PET和CT图像影像组学特征构建临床及联合模型,预测PFS临床模型训练集C-index为0.748、AUC值为0.758,联合模型C-index及AUC值分别为0.775和0.780,验证集临床模型C-index及AUC值分别为0.729和0.776,联合模型分别为0.755和0.791。该研究显示基于治疗前 18F-FDG PET/CT影像组学模型能够较好地预测NSCLC患者PFS,在结合临床因素后预测效能进一步提高。

    目前关于影像组学在预测NSCLC患者无进展生存期中的应用研究相对较少,前述研究的样本量都相对较小,仍需进行大样本研究证实。

    淋巴结转移是影响患者预后及治疗决策选择的重要因素之一。Cong等[23]回顾性研究 649例IA期非小细胞肺癌患者,通过随机森林(random forest,RF)方法建立临床模型、增强CT影像组学模型和联合模型预测早期NSCLC癌患者淋巴结转移,影像组学模型和联合模型对淋巴结转移的预测效能较佳,均优于临床模型,研究表明基于增强CT影像组学模型可以术前预测IA期NSCLC患者的淋巴结转移。Ran等[24]提取300名肺腺癌患者的CT影像组学特征以及深度学习特征,使用多变量逻辑回归分析构建淋巴结转移预测模型以及列线图,多变量逻辑回归分析显示影像组学特征、深度学习特征是淋巴结转移的独立预测因子。预测模型训练集一致性指数为0.820,外部验证集一致性指数为0.861,均具有较好的预测效能,可用于预测肺腺癌患者淋巴结转移。Wang等[25]探究基于肿瘤内和肿瘤周围肺实质CT影像组学模型在术前预测临床T1期周围型肺腺癌患者淋巴结转移的价值,分别提取T1期周围型肺腺癌患者大体肿瘤体积(GTV)和肿瘤周围体积((peritumoral volume,PTV),肿瘤周围1.5 cm)的影像组学特征,通过逻辑回归分析构建包含影像组学特征和临床参数的影像组学模型并建立列线图,结果显示基于GTV和PTV的影像组学特征具有良好的预测效能,其接受者操作特性曲线下面积(area under curve,AUC)分别为0.829和0.825,基于大体肿瘤体积和肿瘤周围体积的联合影像组学特征的AUC为0.843,影像组学列线图的AUC为0.869,该研究表明基于大体肿瘤体积和肿瘤周围体积的影像组学特征均可以较好地预测淋巴结转移。

    研究显示影像组学对于NSCLC患者淋巴结转移具有良好的预测效能,但目前相关研究的样本量相对较小且涉及临床因素较为有限,仍需进一步探究及完善。

    晚期NSCLC患者常出现远处转移,远处转移多提示预后不佳。NSCLC远处转移常见于脑转移及骨转移。

    Chen等[26]从89例T1期肺腺癌患者的平扫CT图像中提取共影像组学特征建立模型,联合模型和影像组学模型的预测效能显著优于临床模型,该研究显示基于CT影像组学对T1期肺腺癌患者脑转移具有良好的预测性能和巨大潜力。Ding等[27]基于平扫CT图像影像组学特征构建影像组学、临床和联合模型预测同步脑转移(synchronous brain metastasis,SBM),比较不同模型的预测效能,并研究3种模型对SBM、异时脑转移(metachronous brain metastasis,MBM)和全部脑转移中寡转移(1~3个病灶)或多发(>3个病灶)转移的预测效能。影像组学模型和联合模型对同步脑转移的预测能力较临床模型更优,此外影像组学模型还可预测同步脑转移、异时脑转移和全部脑转移中寡转移或多发转移。该研究表明影像组学模型及联合模型可作为预测肺癌同步脑转移高危患者的有效影像标志物,且影像组学模型还可以识别寡转移或多发脑转移。Chen等[28]回顾性分析195例NSCLC患者,采用t检验、秩和检验、$\chi^2 $检验分析患者临床影像学特征与骨转移的关系,同时提取影像组学特征构建模型,并根据最佳预测模型提取的影像组学参数结合临床影像特征建立多因素logistic回归预测模型,模型训练集和验证集的AUC为0.82和0.73,研究显示性别、细胞角蛋白19的可溶性片段(Cyfra21-1)升高、血铁含量、CT征象(如病灶同质性、胸膜凹陷征)及影像组学特征Glszm_Small Area高灰度强调是骨转移的独立危险因素,该研究认为基于影像组学和临床影像特征建立的预测模型对NSCLC患者骨转移具有较好的预测能力。

    上述研究表明影像组学能够预测NSCLC的远处转移,但目前现有相关研究相对较少,且上述研究具有样本量小、单中心等局限,仍需进一步大样本、多中心研究。

    影像组学技术在预测NSCLC预后方面展现出较大的潜力,但其作为影像学领域中的新兴交叉学科,仍存在研究多为回顾性、小样本、单中心等不足,缺乏前瞻性、大样本、多中心的研究验证及综合评估,缺乏标准化数据库的建立、标准化研究流程、图像重建算法、预处理方式以及特征提取算法,研究的稳定性及可重复性尚待进一步提高,从而导致临床广泛应用受到一定限制。

    目前影像组学技术仍在不断快速发展,相信在日益发展的人工智能技术的推动下,影像组学技术能够在NSCLC预后预测方面中发挥更大的价值,并在指导NSCLC精准个性化治疗中发挥更大优势及作用。

  • 图  1   无向图及其邻接矩阵特征向量

    Figure  1.   Feature vectors of the undirected graph and its adjacency matrix

    图  2   相同数据集不同聚类方式分类结果

    Figure  2.   Classification results of the same dataset by different clustering methods

    图  3   物理模型的采集尺寸及参数示意图

    Figure  3.   Schematic of the acquisition size and parameters of the physical model

    图  4   模型砂体空间分布

    Figure  4.   Spatial distribution of sand body model

    图  5   三维地震体及控制层位

    Figure  5.   3D seismic body and control horizon

    图  6   物理模型偏移剖面及基于地震沉积学原理解释的层位

    Figure  6.   Migration section of the physical model and horizon interpretation based on the seismic sedimentology principle

    图  7   作为聚类输入的200个波形曲线

    Figure  7.   Two hundred waveform curves as a clustering input

    图  8   物理模型第2至第5层砂、泥岩空间展布及形态

    Figure  8.   Spatial distribution and morphology of sand and mudstone in the second to fifth layers of the physical model

    图  9   为各层的地层切片均方根振幅地震相

    Figure  9.   Slices of root mean square amplitude seismic phase of stratums

    图  10   各层MKSC 聚类地震相分布

    Figure  10.   MKSC clustering seismic facies distribution of stratums

    图  11   目标区基于地震沉积学原理解释的层位

    Figure  11.   Horizon interpretation based on seismic sedimentological principles in the target area

    图  12   H3顶面时间域构造图

    Figure  12.   Time domain structure of H3 top surface

    图  13   A井H3取心段解释图

    Figure  13.   Interpretation diagram of H3 coring section of well A

    图  14   分流河道中心部位不同水动力条件下的相变示意图

    Figure  14.   Schematic diagram of phase transition in the central part of distributary channel under different hydrodynamic conditions

    图  15   E~A~D井连井剖面

    Figure  15.   Connecting well profile of Wells E~A~D

    图  16   H3c段MKSC聚类属性平面图和沉积相平面图

    Figure  16.   MKSC clustering attribute plan and sedimentary facies plan of H3c

    图  17   H3b段MKSC聚类属性平面图和沉积相平面图

    Figure  17.   MKSC clustering attribute plan and sedimentary facies plan of H3b

    表  1   不同聚类分析算法计算效率比较

    Table  1   Comparison of the computational efficiency of different clustering analysis algorithms

    算法类型Mini-batch K-meansSpectral clusteringMKSC
    计算时间/s0.170.210.17+0.09
    下载: 导出CSV
  • [1]

    ZENG H, BACKUS M M, BARROW T K, et al. Stratal slicing, Part I: Realistic 3-D seismic model[J]. Geophysics, 1998, 63(2): 502−513. doi: 10.1190/1.1444351

    [2]

    ZENG H, HENRY C S, RIOLA P J. Strata slicing; Part II, Real 3-D seismic data[J]. Geophysics, 1998, 63(2): 514−521. doi: 10.1190/1.1444352

    [3]

    ZENG H, HENTZ F T, WOOD J L. Stratal slicing of Miocene-Pliocene sediments in vermilion block 50-Tiger Shoal Area, offshore Louisiana[J]. The Leading Edge, 2012, 20(4): 408−418.

    [4]

    ZENG H, AMBROSE A W, VILLALTA E. Seismic sedimentology and regional depositional systems in Mioceno Norte, Lake Maracaibo, Venezuela[J]. The Leading Edge, 2001, 20(11): 260−269.

    [5]

    BHATTACHARYA S, CARR R T, PAL M. Comparison of supervised and unsupervised approaches for mudstone lithofacies classification: Case studies from the Bakken and Mahantango-Marcellus Shale, USA[J]. Journal of Natural Gas Science and Engineering, 2016, 33: 1119−1133. doi: 10.1016/j.jngse.2016.04.055

    [6] 刘爱群, 陈殿远, 任科英. 分频与波形聚类分析技术在莺歌海盆地中深层气田区的应用[J]. 地球物理学进展, 2013, 28(1): 338-344.

    LIU A Q, CHEN D Y, REN K Y, Frequency decomposition and waveform cluster analysis techniques Yinggehai Basin gas field in the deep area of application[J]. Progress in Geophysics, 2013, 28(1): 0338-0344. (in Chinese).

    [7] 白博, 舒梦珵, 康洪全, 等. 基于伪阻抗体波形聚类的贝壳灰岩储层预测方法[J]. 物探化探计算技术, 2015, 37(6): 724-727.

    BAI B, SHU M C, KANG H Q, et al. Coquina reservoir prediction method of seismic pseudo-impedance waveform clustering[J]. Computing Techniques for Geophysical and Geochemical Exploration, 2015, 37(6): 724-727. (in Chinese).

    [8] 李辉, 罗波, 何雄涛, 等. 基于地震波形聚类储集砂体边界识别与预测[J]. 工程地球物理学报, 2017, 14(5): 573-577.

    LI H, LUO B, HE X T, et al. Boundary identification and prediction of sand body based on seismic waveform[J]. Chinese Journal of Engineering Geophysics. 2017, 14(5): 573-577. (in Chinese).

    [9] 徐海, 都小芳, 高君, 等. 基于波形聚类的沉积微相定量解释技术研究−以中东地区 X油田为例[J]. 石油物探, 2018,57(5): 744−755. doi: 10.3969/j.issn.1000-1441.2018.05.014

    XU H, DU X F, GAO J, et al. Quantitative interpretation of sedimentary microfaacies based on waveform clustering: A case study of X oilfield, Middle East[J]. Geophysical Prospecting for Petroleum, 2018, 57(5): 744−755. (in Chinese). doi: 10.3969/j.issn.1000-1441.2018.05.014

    [10] 刘仕友, 宋炜, 应明雄, 等. 基于波形特征向量的凝聚层次聚类地震相分析[J]. 物探与化探, 2020,44(2): 339−349. DOI: 10.11720/wtyht.2020.1153.

    LIU S Y, SONG W, YING M X, et al. Agglomerative hierarchical clustering seismic facies analysis based on waveform eigenvector[J]. Geophysical and Geochemical Exploration, 2020, 44(2): 339−349. DOI: 10.11720/wtyht.2020.1153. (in Chinese).

    [11] 杨随心, 耿修瑞, 杨炜暾, 等. 一种基于谱聚类算法的高光谱遥感图像分类方法[J]. 中国科学院大学学报, 2019,36(2): 267−274. doi: 10.7523/j.issn.2095-6134.2019.02.015

    YANG S X, GENG X R, YANG W T, et al. A method of hyperspectral remote sensing image classification based on spectral clustering[J]. Journal of University of Chinese Academy of Sciences, 2019, 36(2): 267−274. (in Chinese). doi: 10.7523/j.issn.2095-6134.2019.02.015

    [12]

    NG A Y, JORDAN M I, WEISS Y. On spectral clustering: Analysis and an algorithm[J]. Advances in Neural Information Processing Systems, 2001, 14: 849−856.

  • 期刊类型引用(1)

    1. 杨庆东,彭泱泱,李绿洲. 腹壁侵袭性纤维瘤误诊为子宫肌瘤1例及文献复习. 中国当代医药. 2025(09): 138-142 . 百度学术

    其他类型引用(0)

图(17)  /  表(1)
计量
  • 文章访问数:  225
  • HTML全文浏览量:  114
  • PDF下载量:  50
  • 被引次数: 1
出版历程
  • 收稿日期:  2023-06-07
  • 修回日期:  2023-07-26
  • 录用日期:  2023-08-03
  • 网络出版日期:  2023-09-10
  • 刊出日期:  2024-01-09

目录

/

返回文章
返回
x 关闭 永久关闭