学习DAVID数据库(1)
在学习David,一个存储生物信息的在线数据库。文章根据B站提供的DAVID教学视频,记录了如何用DAVID进行基因ID转换。
简介:
DAIVD是一个生物信息数据库,也是一款在线免费分析软件,可以帮助用户从大规模的基因或蛋白列表提取系统综合的生物功能注释信息(term),该数据主要用于鉴别基因的功能的差异和通路富集分析。网页:DAVID: Functional Annotation Result Summary
官方提供给没有基因号的用户的练习数据demolist1和demolist2
https://david.ncifcrf.gov/helps/demo1.txt
https://david.ncifcrf.gov/helps/demo2.txt
demolist1记录相对于CD4+/CD62L-T细胞,上调CD4+/CD62L-T细胞内发现的164个差异表达的基因
上传的txt文件内容可以是基因ID或是基因名字,不同基因名字用换行符分开。
DAVID基因ID转换工具
常用的基因数据库是Ensembl或是NCBI
在打开的NCBI网页搜索框上输入基因ID:3781,查找相关基因信息:
KCNN2是基因名称,3781是KCNN2的基因ID,这两者都可以作为DAVID的输入数据
upload栏操作:
将txt文件内的基因名字或是基因ID copy到 box A里,或者直接txt文件
select identifier 选择栏
entrez_gene_id:对应上传数据数基因ID
official_gene_symbol :对应上传数据为基因名字
step3 点选 Gene List
step4 点击 Submit List ,页面内容更新到step2:
提交基因列表后,step2通过多个分析方向,①Functional Annotation Tool 功能 进行基因富集分析,②Gene ID Conversion Tool功能进行基因ID转换,例如将NCBI基因库的ID号转化为Ensembl库的基因号(都是对应同一个基因)
查找物种拉丁文名字:
在进行基因ID转换,需要指定转换的物种,需要输入物质的拉丁文名字或是对应的物种ID号,例如human的拉丁文homo sapiens,对应的物种ID:9606
在NCBI网页内可以查找需要的物种拉丁文名字和对应的物种ID
①下拉框选中查找范围Taxomomy(分类学)-->②输入目标物种的英文名,例如小鼠mouse --> 点击search -->③展示匹配到的物种信息
基因ID转换:
①视频中上传了2500个基因ID,数据库内匹配到2355人类基因和1个未知基因
②下拉框选择希望转换成的ID格式,视频中选择official_gene_symbol,就是官方的基因名字
③指定该基因所属的物种
④点击提交,进行转换,等待转化完毕
①5转化的状态,successful说明转化成功
②From列,是上传的基因数据
③To列,是转换成的结果,根据选择的official_gene_symbol,转化成的基因名字
④To列只是基因名字的缩写,David Gene Name列是完整的基因名
点击上方的Download File进行txt文件下载,用Excel打开
参考视频链接:
更多推荐
所有评论(0)