点击蓝字

关注我们

ef4fec525fe2a7e0c14d3baaffaf8e41.gif

标题:ARGfams: 一种适用于环境样本抗生素抗性基因快速注释与新基因发现的工具与数据库资源

作者:鞠峰(研究员)、黄昕瑜(博士生)

作者单位:西湖大学环境微生物组与生物技术实验室

抗生素和其他抗菌药物是现代医药成功发挥疗效的关键所在,它们显著改善了人类和动物的健康。然而,抗生素过度使用和误用导致疗效降低。目前抗生素耐药性已成为了全球卫生、食品安全和发展的最大威胁之一(世界卫生组织WHO, 2018)。抗生素耐药性通过抗生素抗性基因(Antibiotic Resistance Gene, ARG)来实现,部分ARG是微生物天然携带的,也有一些ARG是后天通过水平基因转移而获得的。抗生素抗性基因被认为是一种新型污染物,其环境调研与临床监测对于风险预警与阻控非常重要。因此,开发一套适合于从环境样本的海量基因组测序数据中快速注释ARG并有效预测新ARG的技术流程及配套工具与数据库资源是有效开展环境耐药组研究的基本前提与基石。

近几十年来基于DNA序列比对(SA)与相似度匹配的经典方法被广泛应用,已经形成了一系列比对性能优良的SA工具(如NCBI’s BLAST, Usearch, Diamond)。由于近十余年来高通量DNA测序技术与宏基因组学方法的迅猛发展,SA法与相关工具已被广泛应用于环境乃至临床样品中ARG检测及多样性与归趋调研。然而,该法通常要求在输出结果中施加严苛的序列相似度、覆盖度等参数的过滤阈值,以保障其应用于环境样本ARG注释的准确性,这会导致假阴性注释比例的急剧升高,无法预测低于阈值的ARG序列,特别是新ARG,低估了环境耐药组的实际ARG多样性与新颖性。针对这一现状,同时考虑到目前对于抗生素抗性基因认知仍处在飞速扩张的阶段,我们开发了一个基于蛋白质隐马尔可夫模型(HMM)的注释工具及配套的结构化数据库——ARGfams,以满足当前对于环境样本中ARG快速注释与新基因发现的迫切需求。ARGfams的注释策略与数据库资源简述如下:

01

注释策略

ARGfams利用HMMER强大的搜索功能,针对配置好的高质量结构化的ARG HMM模型数据库进行搜索,以快速注释来自基因组和宏基因组组装重叠群中的ARG。该注释工具不仅能从重叠群中的开放阅读框 (ORF) 或蛋白质编码基因 (PCG) 中识别已知ARG,相较于经典的序列比对预测ARGfams在针对环境样本的ARG注释上更具优势,因为基于HMM模型的搜索比对策略在挖掘与已知ARG低同源性的抗性基因上更具优势,这也赋予了ARGfams挖掘新的ARG的能力。ARGfams提供了两种注释策略,原则上两种注释测策略产生的结果相同。

策略 1 (默认):ARGfams_v0.1仅针对本研究策划整合后的ARGfams子数据库,执行一步比对,hmmscan输出结果(默认:--cut-ga模式)中得分大于50分的最佳比对结果被注释为ARG。

策略 2 (可选):ARGfamsPlus_v0.1在针对本课题组策划整合后的ARGfams子数据库执行完一步比对后,将满足条件的潜在ARG序列抽出,与用户自定义的另一个ARG数据库进行第二次比对。两步比对将单独输出不一致的比对结果,用户可以基于人工校验差异注释的结果后获得的信息,来进一步扩展/优化或更新ARGfams的子数据库。因此,ARGfams数据库具有用户自迭代的核心特征。

02

数据库资源

ARGfams的结构化子数据库由从Pfam(v34.0)、TIGRFAMs(v15.0)和Resfams(Full-v1.2)的全库中提取的197个抗生素抗性基因的HMM模型组成,他们通过关键词匹配的方式被抽出并完成了人工校验。ARGfams的结构化子数据库(v0.1)中的ARGs根据它们赋予耐药性的抗生素类别分为11种类型(主型),包括氨基糖苷类(aminoglycoside)、β-内酰胺类(beta-lactam)、博来霉素(bleomycin)、氯霉素(chloramphenicol)、柔红霉素(daunorubicin)、大环内酯类-林可酰胺-链霉素(macrolide-lincosamide-streptogramin,MLS)、多药耐药类(multidrug)、喹诺酮类(quinolone)、四环素(tetracycline)、甲氧苄啶(trimethoprim)、万古霉素(vancomycin),再根据蛋白家族进一步分为161个亚型。有关该结构化子数据库的构建方法和更多详细信息,见文末的参考文献。

最新版ARGfams的工具包与数据库已经在西湖大学环境微生物组与生物技术实验室(EMBLab)的Github主页中同步更新,可通过下方链接访问与获取:https://github.com/emblab-westlake/ARGfams

抗生素抗性基因在环境中不仅可以通过微生物的裂解增殖产生垂直转移与扩散,他们还可以在可移动遗传元件(Mobile Genetic Element, MGE)的介导下通过水平基因转移事件发生水平传播,进一步导致抗性基因在微生物中更广泛的分布与丰度的增加,因此,关注可移动遗传元件,也是针对耐药问题的研究中不可忽视的部分。针对环境样本MGE注释,我们基于相同的设计策略,完成了MGE指示基因(iMGE)注释工具和对应的结构化数据库MGEfams的开发,可以与ARGfams配套用于基因组或宏基因组数据的功能注释,以评估环境细菌携带ARG与MGE的基因组共线性关系,进而预测特定ARG发生水平基因组转移的潜力。

MGEfams可以通过下方链接访问与获取:https://github.com/emblab-westlake/MGEfams

备注:如有任何使用上的问题或建议,请联系:jufeng@westlake.edu.cn (鞠峰) 和 huangxinyu@westlake.edu.cn(黄昕瑜)。

Reference:

Huang, Xinyu and Ju, Feng*. 2023. Fast functional annotation and explorative prediction of antibiotic resistance genes from environmental samples using ARGfams (in prep).

He L#, Huang X#, Zhang G, Yuan L, Shen E, Zhang L, Zhang XH, Zhang T, Tao L*, Ju F*. 2022. Distinctive signatures of pathogenic and antibiotic resistant potentials in the hadal microbiome. Environmental Microbiome. 17(1):19. 

END

467089c5d9c5f103b34161e2599e4c15.gif

EMBLab

环境微生物组与生物技术实验室

1fbc2e6aa0df9fc203069f496d83eed0.gif

环境微生物组学研究环境中全部微生物及其遗传信息,其方法学基础与理论拓展应用是国际学术前沿和热点。西湖大学环境微生物组与生物技术实验室开展环境工程学与微生物学交叉学科研究,研究兴趣包括:1)环境工程与合成微生物组学;2)微生物组的群落构建理论与功能原理;3)抗生素耐药性产生与传播机制及风险监控;4)持久性有机污染物(塑料与药物)降解转化及健康效应;5)废水处理中磷资源利用与回收。

d7f203427d49027e221f1b33f4a7d2ad.png

EMBLab成员

实验室目前招聘

环境微生物组学与合成功能菌群/抗生素耐药与病原菌监测及组学研究/新污染物治理科学与技术方向【博士后】2 名。环境科学与工程、微生物学、基因工程、合成生物学、生物信息学、昆虫学专业【科研助理】2名。

欢迎大家与我们联系。

联系邮箱:

jufeng@westlake.edu.cn

xuyisong@westlake.edu.cn

54f4647f444cc65c012066dfa44498cf.png

鞠峰

EMBLab负责人

鞠峰,西湖大学研究员、博士生导师,环境微生物组与生物技术实验室(EMBLab)负责人、浙江省海岸带环境与资源研究重点实验室副主任。现任西湖大学工学院特聘研究员(环境学)、西湖实验室PI,兼聘生命科学学院(生物学),开展环境微生物组学研究。目前担任Frontiers in Microbiology副主编、中国工程院院刊Engineering、Engineering in Life Science等SCI期刊编委,以及Critical Reviews in Environmental Science Technology、Journal of Environmental Sciences、Environmental Science & Ecotechnology、The Innovation、iMeta等期刊青年编委,曾担任加拿大自然科学与工程理事会(NSERC)国际评审专家。曾获Engineering“编委年度贡献奖”(2021)、中国生态学会“水云天微生物生态青年科技创新奖-特等奖”(2018)、香港科学会“青年科学家奖”(2016)、香港大学“杰出研究生奖”(2015)等奖项。近三年主持或参与国家级或省部级科研项目4项(含国家重点项目1项、省杰青1项)。目前参编中英文专著6本,以第一或通讯作者在Nature Communications、ISME Journal、Advanced Science、Environmental Science & Technology、Water Research、Environment International国际知名学术期刊等发表SCI论文60余篇,引用 4200余次。

猜你喜欢

iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索  Endnote

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

点击阅读原文

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐