利用R语言的singleR包进行自动注释,singleR自带的7个参考数据集,其中5个是人类数据,2个是小鼠的数据。

        其中,人类数据库为:HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、NovershternHematopoieticData、MonacoImmuneData,小鼠数据库为:MouseRNAseqData、ImmGenData。

        HumanPrimaryCellAtlasData来自人类原代细胞的公开可用微阵列数据集组成。大多数标签指的是血液亚群,但也有其他组织的细胞类型。

        BlueprintEncodeData包括纯基质和免疫细胞的bulk RNA-seq数据。

        DatabaseImmuneCellExpressionData由来自同名项目的分选细胞群体的bulk RNA-seq样本组成。

        NovershternHematopoieticData由来自GSE24759的经分类的造血细胞群体的微阵列数据集组成。

        MonacoImmuneData来自GSE107011的部分免疫细胞群体的bulk RNA-seq样本。

        MouseRNAseqData由从基因表达综合库下载的小鼠bulk RNA-seqdata集合组成。有多种细胞类型可供选择,同样主要来自血液,但也覆盖了其他几种组织。

        ImmGenData包括来自同名项目的纯小鼠免疫细胞的微阵列图谱。这是目前分辨率最高的免疫参考——考虑到精细标签的粒度,可能绝大多数都是这样。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐