创新无监督学习重塑AML分型:HARMONY联盟研究揭示17个全新生物学亚群丨EHA 2025

血液时讯 发表时间:2025/9/10 15:52:53

在近期于意大利米兰盛大举行的欧洲血液协会(EHA)年度大会上,全球血液学领域的顶尖专家齐聚一堂,共同探讨了血液系统恶性肿瘤的前沿诊疗策略。其中,关于急性髓系白血病(Acute Myeloid Leukemia, AML)的议题备受瞩目。HARMONY联盟的Amin Turki教授代表其合作团队,发表了一项题为“使用层次狄利克雷混合模型对急性髓系白血病患者进行无监督基因组分类的开发及独立验证”的重要研究,展示了机器学习如何为AML的精准分型与个体化治疗带来革命性突破。

 

急性髓系白血病(AML)作为一种高度异质性的恶性肿瘤,其复杂的生物学特性为临床的精准分型与治疗带来了巨大挑战。尽管现有的临床指南,如欧洲白血病网(ELN)2022版指南,已将基因突变作为核心风险分层依据,将患者划分为低、中、高危三组,但这仍无法完全解释所有患者的预后差异。为了更深层次地理解AML的遗传学图谱,探索更为精准的生物学分型,HARMONY联盟发起了一项大规模研究,旨在“从零开始”,利用创新的无监督学习方法,为AML的分类体系提供全新视角。

 

另辟蹊径:基于无监督学习的AML基因组分型新探索

传统的研究方法往往依赖于已知的生物学或临床标签,而本次研究的核心突破在于其采用了纯粹的无监督学习(unsupervised learning)策略,仅利用患者的基因组学特征数据,让数据“自己说话”。研究团队负责人Amin Turki教授在报告中强调:“我们的目标是,通过一种全新的数据处理方法,从一个大规模、异质化的真实世界数据集中,探索AML潜在的生物学规律。我们相信,识别出具有独特生物学模式的患者亚群,将为设计新的治疗策略和实现个体化风险预测提供关键信息。”

 

为此,研究团队选择了一种先进的机器学习模型——层次狄利克雷混合模型(hierarchical Dirichlet mixture models)。该方法不仅在自适应确定基因簇数量方面表现出强大的稳健性,更具备出色的泛化能力,使其在临床分类应用中潜力巨大。

 

技术突破方面,该研究实现了关键的方法学创新。Turki教授解释道:“我们将基因簇定义为概率分布,具体来说是多元Fisher非中心超几何分布(multivariate Fisher's non-central hypergeometric distributions)。这意味着,每位患者并非被手动、生硬地划入某个类别,而是通过统计学方法被精确地分配至最有可能的生物学簇中,这种方法更具客观性和生物学意义。”
 

这项研究所依赖的开发队列数据源于HARMONY联盟,覆盖了来自欧洲多个国家和中心的5,244名成年AML患者。所有患者均具备全面的86种基因特征信息,且绝大多数接受了标准化疗为主的强化治疗。队列中,不同年龄段以及ELN指南划分的各个风险等级的患者均有良好分布,为模型的稳健训练奠定了坚实基础。

 

 

重磅成果:17个全新生物学亚群的发现与验证

利用这一创新的方法学,研究团队对大规模患者队列进行深入分析后,得出了突破性的成果:该模型成功识别出17个全新的、具有独特基因谱的生物学亚群。Kaplan-Meier生存分析显示,这17个亚群的总生存期(Overall Survival, OS)存在显著差异,证明了新分型系统强大的预后预测能力。

 

尤为引人注目的是,新模型对现有的一些重要基因分型进行了成功细分。例如,经典的NPM1突变型AML被细分为三个预后各异的亚群;与骨髓增生异常综合征(MDS)相关的AML也被分为三类。其中,对16号染色体倒位(inversion 16)这一经典“低危”类型的再分层,完美诠释了新模型的临床价值。研究发现,inversion 16可被分为两个亚群:

 

经典亚群:主要与NRAS突变共存,预后与传统认知一致,相对较好。

 

高危亚群:共存FMS样酪氨酸激酶3(FMS-like tyrosine kinase 3, FLT3)突变。携带这一组合的患者,其总体生存期显著劣于经典亚群。

 

多变量Cox回归分析进一步证实,在校正了年龄、ELN风险分层及异基因造血干细胞移植等因素后,携带FLT3突变的inversion 16患者,其死亡风险显著高于参考组,失去了传统inversion 16的预后优势。

 

为了确保研究结果的可靠性,团队采用了一个独立的、已公开发表的英国国家癌症研究所(NCRI)试验队列作为验证集。结果显示,17个生物学亚群的分布在验证队列中得到了近乎完美的重现。同时,各亚群患者的临床表型特征(如年龄、外周血原始细胞比例、血小板计数等)在开发队列与验证队列中也高度一致,再次证明了该分类模型的稳定性和普适性。


 

 

临床价值:对现有ELN风险分层的补充与优化

那么,这一全新的17亚群分型系统与现行的ELN 2022指南是何关系?Turki教授在问答环节中明确指出,新模型是对现有指南的补充与优化,而非取代。

 

他表示:“我们的分析显示,对于许多患者而言,ELN的风险评估依然非常准确和有效。但我们的模型在某些方面提供了额外的价值。例如,它成功地将inversion 16和NPM1等关键群体进一步细分,并识别出IDH2和MR相关的新簇。通过多变量分析我们发现,这些新亚群能够提供独立于ELN分层之外的预后信息。这表明,新模型可以作为ELN指南的有力补充,帮助临床医生进行更精细的风险评估,并为未来在特定基因亚群中开展靶向治疗临床试验开辟了新的可能性。”

 

专家对话与未来展望

在会议的互动环节,现场专家就模型的细节提出了多个关键问题。当被问及模型是否考虑了突变的克隆结构或等位基因频率(VAF)时,Turki教授坦言,当前模型基于基因突变有或无的二元数据,暂未整合VAF信息,但他认为,结合单细胞测序数据与VAF信息将是未来一个极具价值的探索方向。

 

针对inversion 16伴FLT3突变的高危亚群,专家提问了FLT3突变的具体类型。Turki教授回应,该亚群中包含了内部串联重复(Internal Tandem Duplication, ITD)和酪氨酸激酶结构域(Tyrosine Kinase Domain, TKD)两种突变类型,其中TKD突变在关联性上更为突出。

 

这项研究不仅为AML的生物学理解提供了全新的维度,更展示了在处理复杂医学数据时,创新无监督学习算法与大规模、高质量真实世界数据相结合的巨大潜力。通过对AML遗传异质性的深度剖析,该研究不仅优化了个体患者的预后预测,更为未来开发精准靶向药物、实现个体化治疗策略提供了坚实的理论基础。正如研究的初衷,HARMONY联盟通过开放协作,让全球共享数据与智慧,其成果最终将推动整个血液肿瘤领域向真正的精准医疗时代迈进。

版面编辑:张冉   责任编辑:崔沙沙
本内容仅供医学专业人士参考
相关搜索:  血液肿瘤

发表评论

提交评论
  • 相关推荐
  • 学术领域