引言
癌症研究中,实验模型如癌细胞系和患者源性异种移植模型(PTX)一直是科学家们探索癌症生物学和开发治疗手段的重要工具。然而,这些模型与实际临床肿瘤之间存在显著差异,特别是在基因表达等转录组学特征上。这种差异限制了实验室研究成果的临床转化,导致许多在实验室中成功的治疗策略在临床试验中失效。
为了解决这一挑战,来自瑞士诺华生物医学研究所的Audrey Kauffmann和Eric Y. Durand研究团队在《Science Advances》上提出了一种名为MOBER(Multi-Origin Batch Effect Remover)的深度学习方法。MOBER能够整合来自不同来源的转录组学数据,去除混杂因素,从而帮助研究人员更精准地识别与临床肿瘤高度相似的实验模型。
背景
癌症模型如癌细胞系和PTX模型在癌症研究中发挥着重要作用。然而,与患者肿瘤相比,这些模型在培养条件和生长环境上存在显著差异,导致其生物学特征发生了变化,进而影响其临床可转化性。此外,许多癌症模型缺乏准确的临床注释和组织病理学分类,这进一步限制了它们在癌症研究中的应用价值。因此,找到一种方法来识别那些与患者肿瘤在转录组学特征和药物反应上最为接近的实验模型,成为提高癌症研究临床转化能力的关键。
MOBER方法简介
MOBER是一种基于深度学习的工具,核心是对抗性条件变分自编码器(VAE)的应用。该方法通过两个神经网络协同工作来去除数据中的混杂因素并生成有生物学意义的嵌入:
- 条件VAE:负责生成能够重构原始输入数据的嵌入,同时保留数据中的生物学特征。
- 对抗性神经网络(aNN):试图预测输入数据的来源(如细胞系、PTX模型或临床肿瘤)。
在训练过程中,VAE努力生成无法被aNN准确分类的数据嵌入,同时重建输入数据的生物信息。这种对抗性训练使得最终生成的嵌入空间既能保留生物学差异,又去除了数据来源的混杂信息。
实验与结果
研究人员将MOBER应用于932个癌细胞系、434个PTX模型和11,159个临床肿瘤的转录组学数据,并通过二维均匀流形近似和投影(UMAP)对数据进行降维。未经校正的数据样本根据其来源(如细胞系、PTX模型或临床肿瘤)清晰分离,而经过MOBER处理后,数据样本在转录组学特征上显著融合,同时保留了癌症类型的特异性。
例如,在乳腺癌样本中,患者肿瘤、乳腺癌细胞系和PTX模型根据乳腺癌亚型聚集在一起,显示出MOBER在不同数据来源间保留生物学差异的能力。
此外,MOBER能够在不依赖临床注释的情况下,识别出哪些实验模型与临床肿瘤的转录组特征最为相似。例如,研究发现73%的PTX模型的推断疾病类型与其注释类型相匹配,而这一比例在CCLE(癌细胞系百科全书)模型中仅为53%。研究还发现,某些癌症类型(如皮肤、乳腺和结直肠癌)的模型与患者肿瘤的转录组学特征较为接近,而肝脏、食管和胆管癌的模型则与患者肿瘤存在较大差异。
MOBER的应用与优势
MOBER方法在癌症研究中的应用具有以下几个显著优势:
- 多数据来源整合:MOBER能够同时整合来自癌细胞系、PTX模型和临床肿瘤的转录组学数据,去除技术差异和混杂因素。
- 数据转换能力:MOBER可以将实验模型的转录组数据转化为更接近临床肿瘤的特征。这种能力使得研究人员能够更好地预测实验室成果在临床中的表现。
- 无注释依赖:MOBER不依赖于样本的临床注释,能够独立识别实验模型与临床肿瘤的相似性。
应用实例
研究人员利用MOBER转化后的基因表达数据,训练机器学习模型来预测临床肿瘤的特性。例如,通过MOBER转化的细胞系数据训练的模型,在预测TCGA(癌症基因组图谱)患者肿瘤的转移潜力和生存期方面表现出更高的准确性。此外,MOBER的开源Python包和交互式网络应用程序为研究人员提供了便利工具,帮助他们高效选择与临床肿瘤转录组学特征最为接近的实验模型。
关键结论与前景
MOBER方法为癌症研究领域提供了一种强有力的工具,能够整合不同来源的转录组数据,去除批次效应并提升实验模型的临床可转化性。通过MOBER,研究人员可以更精准地选择实验模型,从而加速药物研发和生物标志物研究的进程。
尽管MOBER在癌症研究中展现出广阔的应用前景,其潜力并不仅限于此。未来,它还可能被应用于其他生物医学领域,如神经科学和传染病研究,进一步推动基础研究成果向临床实践的转化。
参考
- 文献:Dimitrieva, Slavica, et al. “Biologically relevant integration of transcriptomics profiles from cancer cell lines, patient-derived xenografts, and clinical tumors using deep learning.” Science Advances 11.3 (2025): eadn5596.
- MOBER开源代码:https://github.com/Novartis/MOBER
- MOBER交互式Web应用:https://mober.pythonanywhere.com
暂无评论内容