我是靠谱客的博主 无辜大门,最近开发中收集的这篇文章主要介绍数据分析学习笔记,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

目录

一.介绍

二.代码实现


一.介绍

集中趋势:均值,中位数,众数,分位数(常用四分位数)

                                     

离中趋势:标准差,方差

数据分布:偏态与峰度

                                    

                         S+:正偏 均值大 为负则反之       

                         数据分布集中强度K越大顶越尖越小越平缓 正态分布的K=3

卡方分布:几个标准正态分布(均值为0方差为1)的平方和满足的分布  ----  待补充

T分布:正态分布的一个随机变量除以一个服从卡方分布的变量----用来根据小样本来估计呈正态分布且方差未知的总体的均值

F分布:构成两个服从卡方分布的随机变量的比值构成的(即就是两个卡方分布的商)----  待补充

二.代码实现

# -*- coding:utf-8 -*-
# @Author: Han
import pandas as pd
import scipy.stats as ss
df = pd.read_csv("DataHR.csv")
# DataFrame
和
Series
两种数据结构
df.mean()
# 求均值
df.median()
# 中位数
df.quantile(q=0.25)
# 四分位数根据参数q
df.mode()
# 众数
df.std()
# 离标准差
df.var()
#方差
df.sum()
#求和
df.skew()
#偏态系数
df.kurt()
#峰态系数
ss.norm()
# 正态分布
ss.norm.stats(moments="mvsk")
#
ss.norm.pdf(0.0)
#指定横坐标返回竖坐标
ss.norm.ppf(0.9)
#累计值 积分为0.9时 从-无穷大到返回值
ss.norm.cdf(2)
#从-无穷积到2的累计概率
ss.norm.cdf(2)-ss.norm.cdf(-2)
ss.norm.rvs(size=10)
#得到10个符合正态分布的数字
ss.chi2()
#卡方分布
ss.t()
# t分布
ss.f()
# f分布
df.sample(n=10)
# 按个数抽样
df.sample(frac=0.001)
#按比例抽样

                                                                           重要的是学会查文档

最后

以上就是无辜大门为你收集整理的数据分析学习笔记的全部内容,希望文章能够帮你解决数据分析学习笔记所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部