我是靠谱客的博主 甜甜猎豹,这篇文章主要介绍pandas中std和numpy的np.std区别pandas中std和numpy的std区别,现在分享给大家,希望可以做个参考。

pandas中std和numpy的std区别

pandas中Series.std的官方文档


numpy中numpy.std的官方文档

原理

    计算标准差时,需要注意numpy中的std和pandas的std在计算标准差时,默认的计算结果会存在不一致的问题。
    原因在于默认情况下,
    numpy计算的为总体标准偏差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时使用,即最终除以n,而非n-1;
    pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求得总体的标准差时使用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

    实际使用时需要注意,并且根据数据情况选择合适的函数,在数据量较大时,推荐使用numpy进行计算。

速度区别

速度由快到慢依次:

s1 = pd.Series([1,2,3,4,5])
#速度由快至慢
np.std(s1.values) > s1.std(ddof=0) > np.std(s1)

最后

以上就是甜甜猎豹最近收集整理的关于pandas中std和numpy的np.std区别pandas中std和numpy的std区别的全部内容,更多相关pandas中std和numpy内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(124)

评论列表共有 0 条评论

立即
投稿
返回
顶部