SEER数据库也可以用机器学习方法做预测 | SEER公共数据库周报
欢迎报名2024年孟德尔随机化方法高级班课程!郑老师团队开设的孟德尔随机化高级班2024年1月20-21日开课,欢迎报名SEER(The Surveillance, Epidemiology, and End Results)数据库是由美国国立癌症研究所于 1973 年建立,是美国常用的癌症数据库,里面包括了各式各样的肿瘤类型,如肺癌、乳腺癌、胃癌等;还提供了各式各样的临床资料,如性别、年龄、..
欢迎报名2024年孟德尔随机化方法高级班课程!
郑老师团队开设的孟德尔随机化高级班2024年1月20-21日开课,欢迎报名
SEER(The Surveillance, Epidemiology, and End Results)数据库是由美国国立癌症研究所于 1973 年建立,是美国常用的癌症数据库,里面包括了各式各样的肿瘤类型,如肺癌、乳腺癌、胃癌等;还提供了各式各样的临床资料,如性别、年龄、TNM 分期等。
一、本周SEER文献预览
本周PubMed数据库“标题/摘要:SEER”搜索发现,本周发表48篇SEER论文,其中共2篇医学1区,6篇医学2区文章,部分文章介绍如下。
部分高分论文列表如下:
1.外国学者文章介绍(一)
标题:淋巴瘤流行病学结果队列研究:设计、基线特征和早期结果
背景:为了解决不断增长的非霍奇金淋巴瘤(NHL)患者当前和长期未满足的健康需求,我们建立了淋巴瘤结局流行病学(LEO)队列研究(NCT02736357;https://leocohort.org/)。
数据来源:采从2015年7月1日至2020年5月31日,在美国8个学术中心共前瞻性纳入7735名18岁及以上新诊断的NHL患者和基于人群的SEER数据(2015-2019)。
方法: 从2015年7月1日至2020年5月31日,在美国8个学术中心共前瞻性纳入7735名18岁及以上新诊断的NHL患者。诊断时的中位年龄为62岁(范围18-99岁)。参与者来自美国49个州,包括538名黑人/非裔美国人(AA), 822名西班牙裔美国人(不分种族),3386名女性,716名年龄<40岁的人,以及1513名农村居民。
结果:在研究基线,我们提取了临床、病理和治疗数据;血清/血浆(N = 5883, 76.0%)和种系DNA (N = 5465, 70.7%);构建了四种主要NHL亚型的组织芯片(N = 1189);收集生活质量(N = 5281, 68.3%)和流行病学危险因素(N = 4489, 58.0%)资料。到2022年8月,共有1492人死亡。与基于人群的SEER数据(2015-2019)相比,LEO参与者的性别、AA种族、西班牙裔和NHL亚型分布相似,而LEO在亚洲和80岁及以上患者中的代表性不足。观察到LEO的1年和2年总生存率与惰性B细胞(滤泡和边缘区)和t细胞淋巴瘤的基于人群的SEER率相似,但比侵袭性B细胞亚型(弥漫性大B细胞和套细胞)的SEER率高10%-15%。
结论:LEO队列是一个强大而全面的国家资源,用于解决临床、肿瘤、宿主遗传、流行病学和其他生物学因素在NHL预后和生存中的作用。
2.外国学者文章介绍(二)
标题:新辅助动脉内细胞减少化疗改善泪腺腺样囊性癌的预后
背景:泪腺腺样囊性癌(LGACC)在历史上与不良预后相关,即使是局部疾病,5年生存率为56%。1988年,我们治疗了第一个新辅助动脉内细胞减少化疗(IACC)的患者。从那时起,我们就使用这个协议作为标准方法。我们的目标是分析LGACC患者接受该方案治疗的结果,并将其与基于人群的队列进行比较,以评估IACC是否可以提高生存率。
数据来源:1988年至2021年间在单一机构接受IACC治疗的所有非转移性LGACC患者和监测、流行病学和最终结果(SEER)登记中确定了所有接受切除治疗的非转移性LGACC患者。
方法:我们前瞻性评估了1988年至2021年间在单一机构接受IACC治疗的所有非转移性LGACC患者。作为对照组,我们从监测、流行病学和最终结果(SEER)登记中确定了所有接受切除治疗的非转移性LGACC患者。我们使用Kaplan-Meier和Cox比例风险建模方法计算疾病特异性生存率。
结果:在单一机构中发现了35例经IACC治疗的非转移性LGACC患者,在SEER数据库中发现了64例经切除术治疗的非转移性LGACC患者。IACC治疗患者的5年和10年疾病特异性生存率分别为84% (95%CI 71-97)和76% (95%CI 60-92)。而基于人群的队列的5年和10年疾病特异性生存率分别为72% (95%CI 62-82)和46% (95%CI 32-60)。生存分析倾向于IACC,其死亡风险降低60% (HR: 0.4;95%可信区间0.2 -0.9)。
结论:与以人群为基础的切除治疗队列相比,IACC可提高疾病特异性生存率。需要在多个机构接受IACC治疗的其他患者提供进一步的外部有效性。
3.中国学者文章介绍(三)
标题:WHO分类中放射性碘治疗对FTC癌症特异性生存的临床结果和意义
背景:世界卫生组织(WHO)分类的滤泡性甲状腺癌(FTC)的临床结果和放射性碘治疗(RAIT)对癌症特异性生存(CSS)的影响尚未得到很好的确定。
数据库:从监测、流行病学和最终结果(SEER)数据库中提取2000年至2020年间符合条件的微创性FTC (mi-FTC)、封装性血管侵入性FTC (ea-FTC)或广泛侵入性FTC (wi-FTC)患者的数据。
方法:从监测、流行病学和最终结果(SEER)数据库中提取2000年至2020年间符合条件的微创性FTC (mi-FTC)、封装性血管侵入性FTC (ea-FTC)或广泛侵入性FTC (wi-FTC)患者的数据。使用倾向评分匹配(PSM)调整差异前后,比较三种亚型FTC患者的癌症特异性生存(CSS),这是主要结局。将不同亚型的FTC患者分为两组:RAIT组和非RAIT组。应用Cox比例风险回归分析发现各PSM队列中与CSS相关因素的关系。
结果:原始队列中分别有2433例mi-FTC患者、216例ea-FTC患者和554例wi-FTC患者入组。mi-FTC和ea-FTC患者的CSS相似(p =0.805),优于wi-FTC患者(p < 0.001;p = 0.021)。Cox比例风险回归分析显示,在mi-FTC PSM组(HR =1.21, 95% CI=0.46-3.18, p =0.705)和wi-FTC PSM组(HR =0.56, 95% CI=0.35-1.08, p =0.086)中,RAIT与改善的CSS均无相关性。然而,亚组分析显示,N1期(HR =0.44, 95% CI=0.20-0.99, p =0.018)或M1期(HR =0.25, 95% CI=00.11-0.53, p <.001) wi-FTC患者可从RAIT中获得CSS优势。
结论:RAIT可为伴有n1期或m1期疾病的wi-FTC患者提供CSS优势。
4.中国学者文章介绍(四)
标题:不同治疗策略对T1结肠神经内分泌肿瘤患者转移和生存的影响
背景与目的:结肠神经内分泌小肿瘤(< 1-2 cm)的局部切除(LE)的疗效和安全性存在争议,因为其转移风险高于直肠神经内分泌肿瘤(NETs)。本研究旨在评估T1结肠NETs的转移风险,并比较LE或根治性手术(RS)后患者的长期预后。
数据库:监测流行病学和最终结果数据库
方法:使用监测流行病学和最终结果数据库对2004-2015年T1结肠NETs患者进行识别。采用多变量logistic回归评估与转移风险相关的因素。使用倾向得分匹配来平衡变量。计算肿瘤特异性生存期(CSS)和总生存期(OS),以估计T1N0M0结肠NETs患者接受LE或RS的预后。
结果:610例结肠NETs患者中,46例(7.54%)诊断时已发生转移。肿瘤大小(11-20 mm) (OR = 9.51;95%置信区间(CI): 4.32-21.45;P < 0.001),右结肠(OR = 15.79;95% ci 7.20-38.56;P < 0.001),粘膜下浸润(OR = 2.08;95% ci 0.84-5.57;P = 0.125)是与转移相关的独立危险因素。515例T1N0M0结肠NETs患者中,LE的整体长期预后与RS组一样好(匹配后,5年CSS: 97.9% vs. 94.6%, P = 0.450;5年OS: 92.7% vs. 85.6%, P = 0.009)。
结论:T1结肠NETs的肿瘤大小(11 ~ 20mm)和部位(右结肠)与转移有关。在没有转移的情况下,LE可能是0-10 mm T1结肠NETs的可行选择,左结肠分化良好/中度,长期生存。
5.中国学者文章介绍(五)
标题:利用机器学习方法研究婚姻状况对胰管癌诊断和生存预测的影响
背景:胰腺癌是一种常见的恶性肿瘤,其中胰导管癌(Pancreatic ductal carcinoma, PDAC)约占95%。由于胰腺导管癌预后较差,明确其预后因素可为医生预测患者生存提供可靠的理论依据。本研究旨在利用倾向评分匹配和机器学习分析婚姻状况对PDAC患者生存结果的影响。目的是建立一种针对已婚PDAC患者的预后预测模型。
数据来源:我们从SEER数据库中共提取了206,968例胰腺癌患者记录。
方法: 我们从SEER数据库中共提取了206,968例胰腺癌患者记录。为了确保已婚和未婚个体的基线特征是平衡的,我们使用了1:1的倾向匹配得分。然后,我们进行Kaplan-Meier分析和Cox比例风险回归来检验配对前后婚姻状况对PDAC生存的影响。此外,我们开发了机器学习模型来预测已婚PDAC患者的5年CSS和OS。
结果:本研究共纳入24,044例PDAC患者。经1:1倾向性匹配,成功入组8043例已婚患者和8043例未婚患者。多变量分析和Kaplan-Meier曲线表明,未婚个体的存活率低于已婚个体。随机森林算法的5年CSS值为0.734,5年OS AUC值为0.795。
结论:本研究发现PDAC患者的婚姻状况与生存之间存在显著关联。已婚患者预后最好,丧偶患者预后最差。随机森林是预测已婚PDAC患者生存的可靠模型。
更多文章如下:
外国学者:
中国学者:
一个专门做公共数据库的公众号,关注我们
更多推荐
所有评论(0)