概述
一、什么是统计学
- 描述统计:通过对数据的汇总、概括与分析,得出所关心的数据特征。
- 推断统计:通过样本数据来推断总体特征,包括参数估计和假设检验;其中参数估计是用样本信息推断所关心的总体特征,而假设检验是利用样本信息判断对总体的某个假设是否成立。
二、变量与数据
类别变量(定性数据):无序类别变量(数据名义值):即变量之间不存在顺序关系,如学生的学科成绩,语文、数学等。
有序类别变量(数据顺序值):变量之间存在顺序关系,如用户对商品的评价,好、很好、一般等。
数值变量(定量数据):离散变量(有限值):能够一一列举的有限点
连续变量(无限值):在一定区间内连续取值
另外根据数据的时间性质可以将数据分为截面数据和时间序列数据:
截面数据:在相同的时间或近似相同的时间点上收集的数据,通常是不同空间下同意时间截面的数据,如2017年我国各省GDP
时间序列数据:不同时间内收集的数据,如2000年到2017年我国的GDP产值
三、数据抽样方法
简单随机抽样:重复抽样、不重复抽样
分层抽样
总体抽样
整群抽样:先将整体随机划分为若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,比如可以将宿舍看成一个群,在全校内的宿舍随机抽取。
总结:重点了解了数据或变量的类型,对统计学有一个整体的认识。
最后
以上就是清爽芒果为你收集整理的数据分析入门第一个月——统计学第一章的全部内容,希望文章能够帮你解决数据分析入门第一个月——统计学第一章所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复