概述
一、概述
研究对象 | 一维 | 数据 | 统计学 |
二维 | 事件 | 概率论 | |
统计学 | 集中趋势描述 | 均值 | |
分散度描述 | 方差、标准差 | ||
概率论 | 集中趋势描述 | 期望 | |
分散度描述 | 方差 |
二、对“数据”的描述性分析
1、集中趋势度量:为这批数据找到它们的“代表”
a)均值(u):X = (X1+X2+……+Xn)/n
它的局限性在于“若用均值描述的数据中存在异常值的情况,会产生偏差”
b)中位数:是按顺序排列的一组数据中居于中间位置的数
c)众数:样本观测值在频数分布表中频数最多的那一组的组中数
2、分散性与变异性的量度
a)全距 = max - min:也叫“极差”,用于度量数据的分散程度
b)四分位数:所有观测值从小到大排序后四等分,处于三个分割点位置的数值就是四分位数
Q1:第一四分位数,又称“较小四分位数”,等于该样本中所有数值从小到大排序后第25%的数字
Q2:第二四分位数,又称“中位数”,等于该样本中所有数值从小到大排序后第50%的数字
Q3:第三四分位数,又称“较大四分位数”,等于该样本中所有数值从小到大排序后第75%的数字
c)迷你距:它是一组数据中较小的四分位数与较大四分位数之差
可以通过观测每个数据与均值的距离,各个数值与均值距离越小,变异性越小,数据越集中,距离越大数据越分散,变异性越大。方差和标准差就是这么一对用于表征数据变异程度的概念。
d)方差:度量数据分散性的一种方法,是数值与均值的距离的平方数的平均值
e)标准差:方差的开方
f)标准分:表征了距离均值的标准差的个数
三、关于“事件”的研究分析-概率论
1、一个事件的情况
1.1)期望:表征了综合考虑事情的各种结果和结果对应的概率后这个事情的综合影响值(一个事件的期望,就是代表这个事件的“代表值”,类似于统计里面的均值)
1.2)方差:表征了事件不同结果之间的差异或分散程度
2、分布
2.1)离散型分布
离散数据的概率分布,就是离散分布。这三类离散型的分布,在“0-1事件”中可以采用,就是一个事只有成功和失败两种状态
a)几何分布:进行一系列独立试验,每一次实验或成功或失败,每一次成功的概率相同。你主要想知道:为了取得第一次成功,需要进行多少次实验
b)二项分布:进行了一系列次数有限独立实验,每一次实验或成功或失败,每一次成功的概率相同。你主要想知道:在n次实验中能成功多少次。
c)泊松分布:单个事件在给定区间内随机、独立地发生,已知给定区间内的事件平均发生次数或发生率是有限的。你主要想知道:给定区间内的事件发生次数
2.2)连续型分布:正太分布
3、多个事件的情况:”概率树“和”贝叶斯定理“
四、关于”小样本“预测”大总体“
step1:抽取样本
step2:预测总体
step3:验证结果--利用假设检验判断结论是否真实
五、相关与回归(y = ax + b)
最后
以上就是动听舞蹈为你收集整理的统计学知识点梳理的全部内容,希望文章能够帮你解决统计学知识点梳理所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复