Seurat | 强烈建议收藏的单细胞分析标准流程（基础质控与过滤）（一）

221 阅读 0 评论 146 点赞

我是靠谱客的博主端庄帅哥，这篇文章主要介绍Seurat | 强烈建议收藏的单细胞分析标准流程（基础质控与过滤）（一），现在分享给大家，希望可以做个参考。

1. 写在前面

作为现在最火的scRNAseq分析包，Seurat当之无愧。????
本期开始我们介绍一下Seurat包的用法，先从基础质控和过滤开始吧。????

2.用到的包

rm(list = ls())
library(Seurat)
library(tidyverse)
library(SingleR)
library(celldex)
library(RColorBrewer)
library(SingleCellExperiment)

3. 示例数据

3.1 读取10X文件

这里我们提供一个转成gene symbols的可读文件，如果大家拿到的是Ensemble ID，可以用之前介绍的方法进行转换。

adj.matrix <- Read10X("./soupX_pbmc10k_filt")

3.2 创建Seurat对象

srat <- CreateSeuratObject(adj.matrix,project = "pbmc10k") 
srat

3.3 查看Seurat对象

str(srat)

4. 提取meta.data

这里我们提取一下meta.data，顺便查看一下表头，主要是三列: ????

dataset ID；
UMI/cell (nCount_RNA);
detected genes/cell (nFeature_RNA)。

meta <- srat@meta.data
head(meta)

5.添加信息

5.1 添加线粒体基因信息

不知道大家还记得线粒体基因吗???????
在scRNA-seq中，线粒体基因高表达往往代表细胞状态不佳。????

srat[["percent.mt"]] <- PercentageFeatureSet(srat, pattern = "^MT-")

head(srat$percent.mt)

5.2 添加核糖体基因信息

这里我们试一下添加核糖体基因的信息。????

srat[["percent.rb"]] <- PercentageFeatureSet(srat, pattern = "^RP[SL]")

head(srat$percent.rb)

6. 去除双细胞

scRNAseq的理想情况是每个barcode下只有一个细胞，但在实际情况中会有两个或多个细胞共用一个barcode，我们称之为doublets。????

识别并去除doublets的方法很多，常用的有：????

Scrublet;
doubletCells;
cxds;
bcds;
Hybrid;
DoubletDetection;
DoubletFinder;
Solo;
DoubletDecon。

这里推荐大家使用DoubletFinder，我们就不进行演示了，以后再做具体介绍。????

因为我们事先使用Scrublet做过处理了，这里就直接导入准备好的文件吧。

doublets <- read.table("./scrublet_calls.tsv",header = F,row.names = 1)
colnames(doublets) <- c("Doublet_score","Is_doublet")
srat <- AddMetaData(srat,doublets)
head(srat[[]])

7. 可视化

7.1 小提琴图

这里我们用VlnPlot探索一下特征的分布情况。

VlnPlot(srat, 
        fill.by = "feature", # "feature", "ident"
        features = c("nFeature_RNA","nCount_RNA","percent.mt","percent.rb"),
        ncol = 4, pt.size = 0.1) +
  theme(plot.title = element_text(size=10))

7.2 散点图

这里利用散点图，我们看一下不同变量间的相关性。

FeatureScatter(srat, feature1 = "nCount_RNA", feature2 = "percent.mt")

FeatureScatter(srat, feature1 = "nCount_RNA", feature2 = "nFeature_RNA")

FeatureScatter(srat, feature1 = "nCount_RNA", feature2 = "percent.rb")

FeatureScatter(srat, feature1 = "percent.rb", feature2 = "percent.mt")

FeatureScatter(srat, feature1 = "nFeature_RNA", feature2 = "Doublet_score")

Note!

这里我们可以看到高线粒体基因与低UMI计数相关，可以理解为死细胞。 ????
再看一下核糖体基因与线粒体基因，显著负相关。 ????
doublet和基因表达数之间也有一定的相关性。

8. 添加信息

8.1 过滤

接着我们定义一下过滤条件，将质量差、非单细胞的数据剔除掉。????

srat[['QC']] <- ifelse(srat@meta.data$Is_doublet == 'True',
                       'Doublet','Pass')

srat[['QC']] <- ifelse(srat@meta.data$nFeature_RNA < 500 & 
                       srat@meta.data$QC == 'Pass',
                       'Low_nFeature', srat@meta.data$QC
                       )

srat[['QC']] <- ifelse(srat@meta.data$nFeature_RNA < 500 & 
                       srat@meta.data$QC != 'Pass' & 
                       srat@meta.data$QC != 'Low_nFeature',
                       paste('Low_nFeature', srat@meta.data$QC, sep = ','),
                       srat@meta.data$QC
                       )

srat[['QC']] <- ifelse(srat@meta.data$percent.mt > 15 &
                       srat@meta.data$QC == 'Pass',
                       'High_MT',srat@meta.data$QC
                       )

srat[['QC']] <- ifelse(srat@meta.data$nFeature_RNA < 500 &
                       srat@meta.data$QC != 'Pass' & 
                       srat@meta.data$QC !='High_MT',
                       paste('High_MT',srat@meta.data$QC,sep = ','),
                       srat@meta.data$QC
                       )

table(srat[['QC']])

8.2 可视化

这里我们只将通过过滤条件的数据展示出来，大家可以和过滤前的比较一下。

VlnPlot(subset(srat, subset = QC == 'Pass'), 
        features = c("nFeature_RNA", "nCount_RNA", "percent.mt","percent.rb"), 
        ncol = 4, pt.size = 0.1) +
  theme(plot.title = element_text(size=10))

最后祝大家早日不卷!~

需要示例数据的小伙伴，在公众号回复Seurat获取吧！

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

最后

以上就是端庄帅哥最近收集整理的关于Seurat | 强烈建议收藏的单细胞分析标准流程（基础质控与过滤）（一）的全部内容，更多相关Seurat内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：服务器
浏览次数：221 次浏览
发布日期：2024-06-08 12:15:01
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_7_o_22_fx_13__23_c2.html

Seurat | 强烈建议收藏的单细胞分析标准流程（基础质控与过滤）（一）

1. 写在前面

2.用到的包

3. 示例数据

3.1 读取10X文件

3.2 创建Seurat对象

3.3 查看Seurat对象

4. 提取meta.data

5.添加信息

5.1 添加线粒体基因信息

5.2 添加核糖体基因信息

6. 去除双细胞

7. 可视化

7.1 小提琴图

7.2 散点图

8. 添加信息

8.1 过滤

8.2 可视化

最后

评论列表共有 0 条评论

发表评论取消回复

Seurat | 强烈建议收藏的单细胞分析标准流程（基础质控与过滤）（一）

1. 写在前面

2.用到的包

3. 示例数据

3.1 读取10X文件

3.2 创建Seurat对象

3.3 查看Seurat对象

4. 提取meta.data

5.添加信息

5.1 添加线粒体基因信息

5.2 添加核糖体基因信息

6. 去除双细胞

7. 可视化

7.1 小提琴图

7.2 散点图

8. 添加信息

8.1 过滤

8.2 可视化

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复