我是靠谱客的博主 无辜大门,这篇文章主要介绍数据分析学习笔记,现在分享给大家,希望可以做个参考。

目录

一.介绍

二.代码实现


一.介绍

集中趋势:均值,中位数,众数,分位数(常用四分位数)

                                     

离中趋势:标准差,方差

数据分布:偏态与峰度

                                    

                         S+:正偏 均值大 为负则反之       

                         数据分布集中强度K越大顶越尖越小越平缓 正态分布的K=3

卡方分布:几个标准正态分布(均值为0方差为1)的平方和满足的分布  ----  待补充

T分布:正态分布的一个随机变量除以一个服从卡方分布的变量----用来根据小样本来估计呈正态分布且方差未知的总体的均值

F分布:构成两个服从卡方分布的随机变量的比值构成的(即就是两个卡方分布的商)----  待补充

二.代码实现

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
# -*- coding:utf-8 -*- # @Author: Han import pandas as pd import scipy.stats as ss df = pd.read_csv("DataHR.csv") # DataFrame 和 Series 两种数据结构 df.mean() # 求均值 df.median() # 中位数 df.quantile(q=0.25) # 四分位数根据参数q df.mode() # 众数 df.std() # 离标准差 df.var() #方差 df.sum() #求和 df.skew() #偏态系数 df.kurt() #峰态系数 ss.norm() # 正态分布 ss.norm.stats(moments="mvsk") # ss.norm.pdf(0.0) #指定横坐标返回竖坐标 ss.norm.ppf(0.9) #累计值 积分为0.9时 从-无穷大到返回值 ss.norm.cdf(2) #从-无穷积到2的累计概率 ss.norm.cdf(2)-ss.norm.cdf(-2) ss.norm.rvs(size=10) #得到10个符合正态分布的数字 ss.chi2() #卡方分布 ss.t() # t分布 ss.f() # f分布 df.sample(n=10) # 按个数抽样 df.sample(frac=0.001) #按比例抽样

                                                                           重要的是学会查文档

最后

以上就是无辜大门最近收集整理的关于数据分析学习笔记的全部内容,更多相关数据分析学习笔记内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(57)

评论列表共有 0 条评论

立即
投稿
返回
顶部