我是靠谱客的博主 背后心锁,这篇文章主要介绍数学建模入门-python计算常用统计量常用统计量概念演示封装,现在分享给大家,希望可以做个参考。

文章目录

  • 常用统计量概念
  • 演示
  • 封装

常用统计量概念

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

演示

演示数据如下,保存到磁盘上

身高,体重
172,75
171,62
166,62
160,55
155,57
173,58
166,55
170,63
167,53
173,60
178,60
173,73
163,47
165,66
170,60
163,50
172,57
182,63
171,59
177,64

这里只求了身高的统计量

import pandas as pd
df = pd.read_csv('datas/data1.csv')
print(df['身高'])
print('均值',df['身高'].mean())
print('中位数', df['身高'].median())

print('方差', df['身高'].var())
print('标准差', df['身高'].std())
print('极差', df['身高'].max()-df['身高'].min())

print('偏度', df['身高'].skew())
print('峰度', df['身高'].kurt())

在这里插入图片描述

封装

可以把之前的代码简单封装一下,便于以后使用

def cal_sta(dataFrameColumn):
    print('均值', dataFrameColumn.mean())
    print('中位数', dataFrameColumn.median())

    print('方差', dataFrameColumn.var())
    print('标准差', dataFrameColumn.std())
    print('极差', dataFrameColumn.max() - dataFrameColumn.min())

    print('偏度', dataFrameColumn.skew())
    print('峰度', dataFrameColumn.kurt())

这样当自己需要多个统计量时,就不用一行行写,直接将要计算的列给这个工具方法即可

最后附上其他常用统计量的调用方法

count 	非 NA 值的数量
describe 	针对 Series 或 DF 的列计算汇总统计
min , max 	最小值和最大值
argmin , argmax 	最小值和最大值的索引位置(整数)
idxmin , idxmax 	最小值和最大值的索引值
quantile 	样本分位数(0 到 1)
sum 	求和
mean 	均值
median 	中位数
mad 	根据均值计算平均绝对离差
var 	方差
std 	标准差
skew 	样本值的偏度(三阶矩)
kurt 	样本值的峰度(四阶矩)
cumsum 	样本值的累计和
cummin , cummax 	样本值的累计最大值和累计最小值
cumprod 	样本值的累计积
diff 	计算一阶差分(对时间序列很有用)
pct_change 	计算百分数变化

最后

以上就是背后心锁最近收集整理的关于数学建模入门-python计算常用统计量常用统计量概念演示封装的全部内容,更多相关数学建模入门-python计算常用统计量常用统计量概念演示封装内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(130)

评论列表共有 0 条评论

立即
投稿
返回
顶部