概述
文章目录
- 常用统计量概念
- 演示
- 封装
常用统计量概念
演示
演示数据如下,保存到磁盘上
身高,体重
172,75
171,62
166,62
160,55
155,57
173,58
166,55
170,63
167,53
173,60
178,60
173,73
163,47
165,66
170,60
163,50
172,57
182,63
171,59
177,64
这里只求了身高的统计量
import pandas as pd
df = pd.read_csv('datas/data1.csv')
print(df['身高'])
print('均值',df['身高'].mean())
print('中位数', df['身高'].median())
print('方差', df['身高'].var())
print('标准差', df['身高'].std())
print('极差', df['身高'].max()-df['身高'].min())
print('偏度', df['身高'].skew())
print('峰度', df['身高'].kurt())
封装
可以把之前的代码简单封装一下,便于以后使用
def cal_sta(dataFrameColumn):
print('均值', dataFrameColumn.mean())
print('中位数', dataFrameColumn.median())
print('方差', dataFrameColumn.var())
print('标准差', dataFrameColumn.std())
print('极差', dataFrameColumn.max() - dataFrameColumn.min())
print('偏度', dataFrameColumn.skew())
print('峰度', dataFrameColumn.kurt())
这样当自己需要多个统计量时,就不用一行行写,直接将要计算的列给这个工具方法即可
最后附上其他常用统计量的调用方法
count 非 NA 值的数量
describe 针对 Series 或 DF 的列计算汇总统计
min , max 最小值和最大值
argmin , argmax 最小值和最大值的索引位置(整数)
idxmin , idxmax 最小值和最大值的索引值
quantile 样本分位数(0 到 1)
sum 求和
mean 均值
median 中位数
mad 根据均值计算平均绝对离差
var 方差
std 标准差
skew 样本值的偏度(三阶矩)
kurt 样本值的峰度(四阶矩)
cumsum 样本值的累计和
cummin , cummax 样本值的累计最大值和累计最小值
cumprod 样本值的累计积
diff 计算一阶差分(对时间序列很有用)
pct_change 计算百分数变化
最后
以上就是背后心锁为你收集整理的数学建模入门-python计算常用统计量常用统计量概念演示封装的全部内容,希望文章能够帮你解决数学建模入门-python计算常用统计量常用统计量概念演示封装所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复