COSMIC数据库简介
欢迎关注"生信修炼手册"!
COSMIC是癌症相关体细胞突变位点的最大的数据库之一,网址如下:
https://cancer.sanger.ac.uk/cosmic/
最新版本为v85,更新与2018年5月8日。

整个网站由以下4个项目构成
1. COSMIC
癌症相关的体细胞位点,是整个网站的核心,收录了来自不同研究机构和数据库的体细胞突变数据,并提供了方便的浏览,检索,下载功能。
2. Cell Lines Project
对癌症研究中常用的细胞系样本进行深入研究,分析其突变信息。相比COSMIC, 整个项目中涵盖的变异数据会少一点。该项目网址如下:
https://cancer.sanger.ac.uk/cell_lines
3. COSMIC-3D
通过交互式的网页,展现了基因突变导致的蛋白结构域的变化。该项目网址如下
https://cancer.sanger.ac.uk/cosmic3d/
在搜索框中输入一个具体的基因名称或者蛋白名称,可以查看具体的记录。官
方的DEMO数据如下

4. Cancer Gene Census
在癌症研究中,找到相关的突变基因是最核心的目的之一。通过对各种癌症进行调研,整理了一份癌症相关的突变基因列表,这份列表就是Cancer Gene Census,简称CGC。该项目网址如下
https://cancer.sanger.ac.uk/census
在CGC种,将所有的癌症相关基因分成两类
-
Tier1
对于这部分基因,有充分的证据表明,正是由于这些基因的突变,导致癌症的进一步发生。 -
Tier2
对于这部分基因,只能说在癌症中检测到了大量该基因的突变,但是并没有充分证据表明该基因突变对癌症发生的影响。
登陆之后,可以下载CGC的完整列表

COSMIC不仅提供了原始数据的下载功能,还整理了许多有重要意义的数据集供我们参考和下载。
1. Downloads
下载Cosmic数据库中的数据,有以下几种数据供下载
-
Classification Information
-
COSMIC Complete Mutation Data(Targeted Screens)
-
COSMIC Matation Data(Genome Screens)
-
COSMIC Mutation Data
-
Structural Genomic Rearrangements
-
Complete Fusion Export
-
All Mutations in Census Genes
-
Non coding variants
-
Copy Number Variants
-
Gene Expression
-
Methylation
-
Cancer Gene Census
-
COSMIC Sample Features
-
COSMIC HGNC
-
COSMIC Resistance Mutations
-
ASCAT Ploidy and Purity Estimates
-
VCF Files
按需下载即可。下载时需要登陆的,而且部分数据只对大学和非盈利机构的用户公开。
2. Gene Curation
从Cancer Gene Census基因列表中,挑选没有已知数据库的基因进行展示

3. Gene Fusion Curation
融合基因的列表

4. Genome Screens
对所有的数据集进行了整理,分成了大规模的全基因组数据和来自ICGC, TCGA, PCGP两部分来呈现


5. Drug Resistance
研究药物靶标基因的相关突变,对于临床治疗有重要意义。Cosmic收集和整理了药物靶标基因的相关突变。

6. Mutational Signatures
在癌症中,突变位点是非常多。研究人员提出了Mutational Signatures这个概念,突变的特征集合,共划分了96种突变类型,首先根据碱基突变的类型,有C>A, C>G, C>T, T>A, T>C, T>G共6种基本类型,然后在考虑突变位点上有和下游的1个碱基,每个碱基有A,T,C,G 4种可能的情况,一共就有6X4X4 = 96 种突变类型。
不同癌症中这96种突变类型出现的频率有所不同,将96种突变类型的频率结合起来,可以作为一种固定的突变模式,用来表征某一类癌症。
Cosmic基于10952给外显子和1048个全基因组数据,总结出了30种Mutational Signatures。其中Signature1示例如下

在网站上,还提供了一系列的工具。
1. Cancer Browser
通过不同的组织来查看相关类型的癌症,更加的直观方便。

2. Genome Broswer
基因组浏览器

3. CONAN
copy nunber analysis, 查询拷贝数变异的工具。

4. GA4GH Beacon Query
一个API工具,可以快速查询COSMIC数据库中某个突变是否存在。返回JSON格式的数据,

以上查询对应的链接如下
https://cancer.sanger.ac.uk/api/ga4gh/beacon?allele=A&chrom=7&dataset=cosmic&format=json&pos=140753336&ref=38
返回的内容如下
{
"response" : {
"exists" : "true"
},
"query" : {
"allele" : "A",
"ref" : "GRCh38",
"pos" : "140753336",
"dataset" : "cosmic",
"chrom" : "7"
},
"beacon_id" : "COSMIC Beacon",
"version" : "85"
}
COSMIC数据库中默认的坐标是基于hg38版本的基因组的,可以在首页的Genome Version中选择CRCH37,切换到hg19版本。
扫描关注微信号,更多精彩内容等着你!

更多推荐
所有评论(0)