我是靠谱客的博主 大力手机,最近开发中收集的这篇文章主要介绍UMAP分析及可视化,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

什么是UMAP?和PCA一样,一种降维的算法,如果不是统计学或者数据专业的人,我建议不要去看它的原理,知道如何用就足够了。

也许听到UMAP最多的是对单细胞数据的分析降维,类似于下图:

图片

然而其他数据,像大样本的转录组在PCA降维效果不好的时候,可以使用UMAP,毕竟现在转录非常便宜,随便测几十个样品和玩似的。

首先构建一个数据集,行为样本,列为基因,并对样本的特征进行分组。

图片

读入数据: 

setwd("E:/生物信息学")options(stringsAsFactors= F)####A <- read.csv("UMAP.csv",header = T,row.names = 1)

安装R包:

install.packages("umap")library(umap)

UMAP分析:

A_umap <- A[,colnames(A)!= c('label2', 'label3','label4')]#新构建一个表,不含有labelA_umap <- data.frame(t(apply(A_umap,1,                             function(v){(v-mean(v,na.rm=T))/sd(v,na.rm=T)})),                     stringsAsFactors=F)#标准化umap <- umap(A_umap,method='naive',n_neighbors = 10)    head(umap$layout)    #####################       [,1]      [,2]r1 16.16427 -11.32371r2 16.26652 -11.21803r3 16.28917 -11.45600r4 16.28618 -11.56981r5 16.15085 -12.07527r6 16.65784 -12.28240             

提取分析结果用于作图:

B <- data.frame(umap$layout)B$label <- A$label2 colnames(B) <- c('UMAP_1','UMAP_2','label')

作图是由ggplot实现的,应该很熟悉了:​​​​​​​

ggplot(B, aes(x=UMAP_1, y=UMAP_2, colour=label)) +   geom_point(size=1)+ xlab("UMAP_1")+ ylab("UMAP_2")+   theme(  panel.grid.major = element_blank(),                 panel.grid.minor = element_blank(),                 legend.title=element_blank(),                  panel.border = element_blank(),                 axis.line.x = element_line(color="black", size = 0.5),                 axis.line.y = element_line(color="black", size = 0.5),                 panel.background = element_blank())

图片

降维效果很好,当然图的颜色也是可以修改的,和之前讲的ggplot的修饰一样。除了对样本的分组,还可以展现其他的分组,毕竟数据中我们设置了3

个label,我们看一下以性别的分组作图是什么样的?只需要改动下label即可。

 ​​​​​

C <- data.frame(umap$layout)C$label <- A$label3 colnames(C) <- c('UMAP_1','UMAP_2','label') ggplot(C, aes(x=UMAP_1, y=UMAP_2, colour=label)) +   geom_point(size=1)+ xlab("UMAP_1")+ ylab("UMAP_2")+   theme(panel.grid.major = element_blank(),                 panel.grid.minor = element_blank(),                 legend.title=element_blank(),                  panel.border = element_blank(),                 axis.line.x = element_line(color="black", size = 0.5),                 axis.line.y = element_line(color="black", size = 0.5),                 panel.background = element_blank())

图片

效果不错!

样本多可以试试这个方法,不局限于转录组,其他的任何数据都可以!

想要示例数据的可以打赏截图联系作者获取,记得留下邮箱!

 

最后

以上就是大力手机为你收集整理的UMAP分析及可视化的全部内容,希望文章能够帮你解决UMAP分析及可视化所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(53)

评论列表共有 0 条评论

立即
投稿
返回
顶部