01

文献学习

今天分享的文献是由上海同济大学、上海交通大学医学院等团队于2026年3月在《Advanced Science》(中科院1区top。IF=14.1)上发表的研究”HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Learning“即HiST:通过多尺度融合深度学习利用组织学图像重建肿瘤空间转录组,该研究提出一个名为 HiST 的多尺度融合深度学习框架,旨在利用常规HE染色组织学图像重建肿瘤的空间转录组(spatial transcriptomics, ST)。HiST通过提取组织图像中的形态学特征,预测肿瘤区域和空间基因表达谱(GEPs),并在多个癌种中实现了高精度预测。该模型在肿瘤区域识别、空间基因表达重建、患者预后分层、免疫治疗反应预测等方面均表现出优越性能,显著优于现有方法。

创新点:①提出多尺度融合卷积框架HiST,通过改进U-Net与ConvMixer模块,高效捕捉全局空间上下文与局部形态特征②预测精度显著超越现有模型,平均Pearson相关系数达0.74,较第二名提升约两倍,实现高保真空间转录组重建③首次实现从组织学图像预测免疫治疗疗效,并整合预后分析与肿瘤异质性评估,拓展了HE图像的分子信息挖掘能力

临床价值:①规避空间转录组高昂成本,仅用常规HE染色图像即可推断高精度基因表达谱,降低临床应用门槛②支持患者预后分层与免疫治疗反应预测,为个性化治疗决策提供可解释的分子依据③从组织图像中识别肿瘤异质性与关键通路,辅助病理诊断与精准肿瘤学分析,提升诊疗一体化能力

图 1:HiST框架示意图

a:预处理模块(Preprocess Module)

HE组织学全切片→按空间转录组斑点位置切分为5120个图像块→经预训练Swin Transformer(CTranspath)提取特征→重构为768×80×64空间特征图

b:预测模块(Prediction Module)

基于改进U-Net架构,编码器5层卷积+下采样,解码器对称上采样,加入多尺度注意力门跳跃连接与ConvMixer模块;双输出:

肿瘤区域识别(二分类掩码)

空间基因表达谱(逐基因空间表达矩阵)

c:应用模块(Application Module)

基于ConvNeXt-V2,输入HiST预测的空间转录组特征+临床数据;输出:

患者预后风险分层

免疫检查点阻断(ICB)治疗响应预测

02

研究背景和目的

研究背景

随着肿瘤精准医疗的发展,传统病理诊断仅依赖苏木精-伊红(H&E)染色图像,虽能揭示组织结构与细胞形态,却难以全面反映肿瘤微环境中复杂的分子调控异质性,且诊断结果易受病理医师经验与主观性影响。空间转录组学(ST)技术通过将基因表达与组织空间坐标相结合,为解析肿瘤异质性、免疫微环境及疾病机制提供了关键分子视角,但其高昂成本与长周期限制了其作为临床常规工具的应用。近年来,人工智能(AI)方法尝试从H&E图像中直接预测空间基因表达谱(GEPs),以替代昂贵的ST检测。然而,现有模型如ST‑Net、HisToGene、Hist2ST及IGI‑DL等存在明显局限:一方面,基于Vision Transformer(ViT)或图神经网络(GNN)的架构参数量大、易过拟合,尤其在小规模ST数据集上表现不佳;另一方面,它们对全局空间上下文与局部形态特征的融合不足,导致基因表达预测精度较低(平均皮尔逊相关系数仅约0.34)。此外,现有方法普遍未充分验证预测结果在下游临床任务(如预后分层、免疫治疗响应评估)中的可靠性,限制了其临床转化潜力。

研究目的

针对上述挑战,本研究旨在开发一个名为HiST(Histological Images reconstructs Tumor Spatial Transcriptomics)的新型深度学习框架,其核心目标是从H&E染色组织学图像中高精度重建肿瘤空间转录组谱,并系统验证其在肿瘤区域识别、异质性分析及临床预后预测中的实用性。HiST通过多尺度融合卷积架构,创新性地整合了三个模块:预处理模块利用Swin Transformer提取图像斑块特征并重构空间特征图,以保留全局空间关系与局部形态信息;预测模块基于改进的U‑Net与ConvMixer,实现肿瘤斑点分割和空间基因表达回归;应用模块采用ConvNeXt‑V2,将预测的GEPs用于患者生存分析和免疫治疗响应预测。研究在五种癌症类型(乳腺癌、结直肠癌、肝癌、肾癌、卵巢癌)的102张ST切片上开展,通过留一法交叉验证与多个公开模型对比,旨在证明HiST在基因表达预测精度(预期平均皮尔逊相关系数超0.70)、计算效率及临床任务表现(预后C-index达0.78,免疫响应预测准确率近0.80)上均显著优于现有方法,从而为将常规病理图像转化为可解释的分子图谱、推动空间信息辅助的精准肿瘤诊疗提供技术支撑。

03

数据和方法

研究数据

训练与验证数据:102张ST切片,涵盖5种癌种:

乳腺癌(BRCA,42例)

结直肠癌(CRC,25例)

肝细胞癌(HCC,13例)

肾透明细胞癌(KIRC,14例)

卵巢癌(OV,8例)

外部验证:TCGA数据库中的HE图像与RNA-seq数据;

免疫治疗数据:131例HCC患者(29例响应者,102例非响应者)的HE图像与临床数据。

技术方法

HiST框架结构

预处理模块:提取HE图像中的补丁,使用Swin Transformer提取特征,构建空间特征图;

预测模块:基于改进的U-Net结构,引入多尺度注意力门控和ConvMixer模块,用于肿瘤区域分割和空间基因表达回归;

应用模块:基于ConvNeXt-V2结构,用于预后预测和免疫治疗反应预测。

模型训练策略

小数据集:留一法交叉验证(LOOCV);

大数据集:5折交叉验证;

使用MSE损失(基因表达)和二元交叉熵损失(肿瘤区域)。

评估指标

Pearson相关系数、Spearman相关系数;

AUC、IOU、Dice、F1、精度、召回率等;

C-index用于生存分析。

04

实验结果

肿瘤区域识别

AUC最高达0.96(BRCA),各癌种平均准确率 > 0.80;

预测结果与病理学家注释高度一致。

空间基因表达预测

平均Pearson相关系数为0.74,优于现有模型(如EGNv2仅为0.28);

在ACTB、FTL、UBC等关键基因上预测精度高达0.96以上;

在HER2和cSCC等非Visium平台上也表现优异。

肿瘤异质性分析

HiST预测的GEPs可区分不同肿瘤亚克隆,与真实ST的CNV模式高度一致。

预后预测

HiST预测的GEPs在TCGA五个癌种中均能显著分层高风险与低风险患者;

C-index最高达0.78(BRCA),优于Swin Transformer和ResNet50。

免疫治疗反应预测

预测免疫治疗响应者的准确率为0.79,F1为0.81;

识别的差异基因与真实ST数据高度一致(重叠率44%-46%)。

图 2:多癌种肿瘤区域预测结果

图 3:空间转录组基因表达谱重构性能

图 4:五癌种预后预测性能

图 5:肝癌免疫治疗疗效预测

05

研究结论

该研究提出的HiST框架通过多尺度融合深度学习,成功从H&E染色组织学图像中高精度重建肿瘤空间转录组。其核心结论包括:①在肿瘤区域识别上,HiST在多种癌症类型中表现优异(如乳腺癌AUC达0.96),与病理学家注释高度一致;②在空间基因表达预测方面,HiST的平均皮尔逊相关系数达0.74,较现有模型提升约两倍,且计算效率更高;③预测的空间转录组谱能有效揭示肿瘤异质性(如区分不同CNV亚克隆),并在预后分层(如乳腺癌C-index达0.78)和免疫治疗响应预测(准确率0.79)中展现出显著临床应用价值;④HiST在多种独立数据集和平台上的泛化能力强,其预测表达与真实RNA-seq高度一致,为缺乏空间转录组数据的临床场景提供了低成本、可解释的分子替代方案。总体而言,HiST实现了从形态学到空间分子信息的跨尺度建模,为精准肿瘤学的临床转化提供了新工具。


参考文献:Li W, Zhang D, Peng E, Shen S, Alinejad-Rokny H, Liu Y, Zheng J, Jiang C, Ye Y. HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Learning. Adv Sci (Weinh). 2026 Mar;13(13):e14351. doi: 10.1002/advs.202514351.

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐