概述
变量、数据与抽样方法
33:《数据分析基础》的复习笔记1
1.概念
2.变量和数据 详细内容
3.抽样方法(概率抽样)
概念:
-
总体(population):所研究的全部个体的集合。
-
样本(sample或individul):总体中抽取的一部分元素的集合。
-
样本量量(sample size):样本容量,样本的元素的数目。
-
参数(parameter):描述总体特征的概括性数字度量。
-
统计量(statistic):描述样本特征的概括性数字度量。
-
数据(数据集):数值(value)的集合,通常被组织为变量和个体。
-
变量(Variable):要测量的某种特征,数据的主要组成部分。
-
个体(Individual)(样本):测量或记录的对象。
变量:(详细内容)
1.分类:
- 分类变量(categorical variable):取值为对象的属性、类别、或区间的变量。
- 数值变量(metric variable):取值为数字尺度的变量。
2.数值变量的分类:
- 离散变量(discrete variable):取值是有限的数值。
- 连续变量(continuous variable):取值在任意区间内、 或多个区间内是任意值。
3.分类变量的分类:
- 无序的分类变量(名义(nominal)值分类变量):其取值之间没有顺序关系。
- 有序的分类变量(顺序(ordinal)值分类变量 / 排序变量):其取值之间具有顺序关系。
数据:(详细内容)
1.分类:
- 观测数据(observational data):通过调查、或观测收集得到的数据。
- 实验数据(experimental data):在实验室中控制或干预实验对象所收集得到 的数据。
2.来源:
- 直接来源:一是来自调查或观察,二是来自实验。
- 间接来源:主要是公开出版或报道的数据,有些是未公开出版的数据。
抽样方法:(详细内容)
1.简单随机抽样(Simple Random Sampling):直接从总体单位中随机抽选样本单位,每个个体被选入样本的概率都相等。
(最基本的抽样方法)
- 有放回抽样(重复抽样):在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。
- 无放回抽样(不重复抽样):在一个单位被选入样本后,不再放回总体参与随后的抽样过程。
2.分层抽样(Stratified sampling)(分类抽样):在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取他定数量的元素组成一个样本。
3.系统抽样(Systematic sampling)(等距抽样):先将总体各元素按照某种顺序排列,并按某种规则确定一个随机起点,然后每隔五定的间距抽取一个元素,直到抽取n个元 素组成一个样本。
4.整群抽样(Cluster sampling):先将总体划分为若干群, 然后以群作为抽样单元从中抽取部分群组组成样本,再对抽中的每个群中包含的所有元素进行调查。
最后
以上就是温柔钢笔为你收集整理的33学习笔记——描述统计分析1--变量、数据与抽样方法的全部内容,希望文章能够帮你解决33学习笔记——描述统计分析1--变量、数据与抽样方法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复