我是靠谱客的博主 过时小鸽子,最近开发中收集的这篇文章主要介绍seurat提取表达矩阵_Seurat包------标准流程,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

841af63f6dd665d9e4be8ca068f0f9ae.png

Seurat官网上详细的指导完全可以满足Seurat包初级使用。不过该网站是英文的,为了方便大家迅速上手,我来走一遍标准流程。我用的是Windows 10, R4.0。 我走的流程原网站地址:https://satijalab.org/seurat/v3.1/pbmc3k_tutorial.html

首先我们需要在自己的RStudio中安装Seurat包

install.packages('Seurat')
library('Seurat')
packageVersion("Seurat")
?Seurat

原参考页面中还使用了一些相关的R包,所以我们也需要一并安装上,如果你已经安装了这些包就跳过这一步

install.packages(c('dplyr','patchwork'))

安装好R包之后,我们要Load进来现在的工作环境

library(dplyr)
library(Seurat)
library(patchwork)

示例数据可以在官网下载:https://support.10xgenomics.com/ 读入的数据可以是一个矩阵,行代表基因,列代表细胞。

1.数据导入

list.files('pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19')
pbmc.counts <- Read10X(data.dir = "pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19")

创建Seurat对象

pbmc <- CreateSeuratObject(counts = pbmc.counts)
pbmc
str(pbmc)

数据集中测到的少于200个基因的细胞(min.features = 200)和少于3个细胞覆盖的基因(min.cells = 3)被过滤掉

pbmc <- CreateSeuratObject(counts = pbmc.counts, project = "pbmc3k", min.cells = 3, min.features = 200)

2.数据质控

质控的参数主要有两个: 1.每个细胞测到的unique feature数目(unique feature代表一个细胞检测到的基因的数目,可以根据数据的质量进行调整) 2.每个细胞检测到的线粒体基因的比例,理论上线粒体基因组与核基因组相比,只占很小一部分。所以线粒体基因表达比例过高的细胞会被过滤。

pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
VlnPlot(pbmc, fe

最后

以上就是过时小鸽子为你收集整理的seurat提取表达矩阵_Seurat包------标准流程的全部内容,希望文章能够帮你解决seurat提取表达矩阵_Seurat包------标准流程所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(46)

评论列表共有 0 条评论

立即
投稿
返回
顶部