我是靠谱客的博主 背后大炮,最近开发中收集的这篇文章主要介绍phyper函数计算的显著性到底是什么?,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

最近做项目遇到一个有趣的问题:有135个肺癌患者,已知这些患者的临床表征(性别、年龄、是否吸烟等),在计算中发现了EGFR基因在队列中显著突变,现在想知道某个临床表征(比如吸烟)对EGFR基因的突变有没有显著的影响?

 

虽然已有文献证明了吸烟对于EGFR突变率和突变谱的影响,这里为了说明证明方法,还是以吸烟这个表征作为例子来举例说明。

 

这个问题类似于抽样检查的问题:工厂生产了N个零件,其中有M个零件是次品,在一次抽样调查中随机抽取n个零件,其中有m个零件是次品,问这次的抽样检查是否合格?也就是要通过抽样调查判断样本是否服从整体的分布。该抽样方法服从超几何分布,利用R中自带的phyper函数可以计算出p-value,这个p-value代表了抽样服从整体的可能性。

pvalue = phyper(m,M,(N-M),n,lower.tail=F)

计算出来的p-value需要进行FDR矫正,经过矫正后的FDR值如果小于0.05则否认原假设,认为抽样不符合整体,抽样结果不合格。

qvalue = p.adjust(pvalue,method='fdr')

回到开头的问题,有答案了吗?类比零件抽样调查的问题,我们需要找到队列总人数135,队列中含有EGFR突变的总人数90,队列中吸烟的人数70,吸烟人群中含有EGFR突变的人数54,然后利用phyper函数进行计算:

pvalue <- phyper(54,90,45,70,lower.tail=F)
qvalue <- p.adjust(pvalue,method='fdr')
qvalue
[1] 0.002012122

FDR=0.002说明吸烟人群的EGFR突变与队列整体的EGFR突变分布差异显著,证明吸烟对于EGFR突变有正向作用。

更多生信小知识关注:

 

最后

以上就是背后大炮为你收集整理的phyper函数计算的显著性到底是什么?的全部内容,希望文章能够帮你解决phyper函数计算的显著性到底是什么?所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部