概述
Seurat官网上详细的指导完全可以满足Seurat包初级使用。不过该网站是英文的,为了方便大家迅速上手,我来走一遍标准流程。我用的是Windows 10, R4.0。 我走的流程原网站地址:https://satijalab.org/seurat/v3.1/pbmc3k_tutorial.html
首先我们需要在自己的RStudio中安装Seurat包
install.packages('Seurat')
library('Seurat')
packageVersion("Seurat")
?Seurat
原参考页面中还使用了一些相关的R包,所以我们也需要一并安装上,如果你已经安装了这些包就跳过这一步
install.packages(c('dplyr','patchwork'))
安装好R包之后,我们要Load进来现在的工作环境
library(dplyr)
library(Seurat)
library(patchwork)
示例数据可以在官网下载:https://support.10xgenomics.com/ 读入的数据可以是一个矩阵,行代表基因,列代表细胞。
1.数据导入
list.files('pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19')
pbmc.counts <- Read10X(data.dir = "pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19")
创建Seurat对象
pbmc <- CreateSeuratObject(counts = pbmc.counts)
pbmc
str(pbmc)
数据集中测到的少于200个基因的细胞(min.features = 200)和少于3个细胞覆盖的基因(min.cells = 3)被过滤掉
pbmc <- CreateSeuratObject(counts = pbmc.counts, project = "pbmc3k", min.cells = 3, min.features = 200)
2.数据质控
质控的参数主要有两个: 1.每个细胞测到的unique feature数目(unique feature代表一个细胞检测到的基因的数目,可以根据数据的质量进行调整) 2.每个细胞检测到的线粒体基因的比例,理论上线粒体基因组与核基因组相比,只占很小一部分。所以线粒体基因表达比例过高的细胞会被过滤。
pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
VlnPlot(pbmc, fe
最后
以上就是过时小鸽子为你收集整理的seurat提取表达矩阵_Seurat包------标准流程的全部内容,希望文章能够帮你解决seurat提取表达矩阵_Seurat包------标准流程所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复