我是靠谱客的博主 饱满流沙,最近开发中收集的这篇文章主要介绍python画经验分布函数_Python经验分布函数(ecdf)实现,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

我知道

statsmodels.tools.tools.ECDF,但由于计算一个empricial累积分布函数(ECDF)非常简单,我想最小化项目中的依赖项,我想手动编码.

在给定的list()/ np.array()Pandas.Series中,每个元素的ECDF可以计算为given in Wikipedia:

我在下面有Pandas DataFrame,dfser,我想得到values列的ecdf.我也给出了两个单线解决方案.

有更快的方法吗?速度在我的应用中很重要.

# Note that in my case indices are unique identifiers so I cannot reset them.

import numpy as np

import pandas as pd

# all indices are unique, but there may be duplicate measurement values (that belong to different indices).

dfser = pd.DataFrame({'group':['a','b','b','a','d','c','e','e','c','a','b','d','d','c','d','e','e','a'],

'values':[2.01899E-06, 1.12186E-07, 8.97467E-07, 2.91257E-06, 1.93733E-05,

0.00017889, 0.000120963, 4.27643E-07, 3.33614E-07, 2.08352E-12,

1.39478E-05, 4.28255E-08, 9.7619E-06, 8.51787E-09, 1.28344E-09,

3.5063E-05, 0.01732035,2.08352E-12]},

index = [123, 532, 235, 645, 747, 856, 345, 245, 845, 248, 901, 712, 162, 126,

198,748, 127,395] )

# My 1st Solution - list comprehension

dfser['ecdf']=[sum( dfser['values'] <= x)/float(dfser['values'].size) for x in dfser['values']]

# My 2nd Solution - ranking

dfser['rank'] = dfser['values'].rank(ascending = 0)

dfser['ecdf_r']=(len(dfser)-dfser['rank']+1)/len(dfser)

dfser

group values ecdf rank ecdf_r

123 a 2.018990e-06 0.555556 9.0 0.555556

532 b 1.121860e-07 0.333333 13.0 0.333333

235 b 8.974670e-07 0.500000 10.0 0.500000

645 a 2.912570e-06 0.611111 8.0 0.611111

747 d 1.937330e-05 0.777778 5.0 0.777778

856 c 1.788900e-04 0.944444 2.0 0.944444

345 e 1.209630e-04 0.888889 3.0 0.888889

245 e 4.276430e-07 0.444444 11.0 0.444444

845 c 3.336140e-07 0.388889 12.0 0.388889

248 a 2.083520e-12 0.111111 17.5 0.083333

901 b 1.394780e-05 0.722222 6.0 0.722222

712 d 4.282550e-08 0.277778 14.0 0.277778

162 d 9.761900e-06 0.666667 7.0 0.666667

126 c 8.517870e-09 0.222222 15.0 0.222222

198 d 1.283440e-09 0.166667 16.0 0.166667

748 e 3.506300e-05 0.833333 4.0 0.833333

127 e 1.732035e-02 1.000000 1.0 1.000000

395 a 2.083520e-12 0.111111 17.5 0.083333

最后

以上就是饱满流沙为你收集整理的python画经验分布函数_Python经验分布函数(ecdf)实现的全部内容,希望文章能够帮你解决python画经验分布函数_Python经验分布函数(ecdf)实现所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(52)

评论列表共有 0 条评论

立即
投稿
返回
顶部