我是靠谱客的博主 温柔钢笔,最近开发中收集的这篇文章主要介绍33学习笔记——描述统计分析1--变量、数据与抽样方法,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

变量、数据与抽样方法

33:《数据分析基础》的复习笔记1

1.概念

2.变量和数据 详细内容

3.抽样方法(概率抽样)

在这里插入图片描述

概念

  • 总体(population):所研究的全部个体的集合。

  • 样本(sample或individul):总体中抽取的一部分元素的集合。

  • 样本量量(sample size):样本容量,样本的元素的数目。

  • 参数(parameter):描述总体特征的概括性数字度量。

  • 统计量(statistic):描述样本特征的概括性数字度量。

  • 数据(数据集):数值(value)的集合,通常被组织为变量和个体。

  • 变量(Variable):要测量的某种特征,数据的主要组成部分。

  • 个体(Individual)(样本):测量或记录的对象。





变量:(详细内容)

1.分类:
- 分类变量(categorical variable):取值为对象的属性、类别、或区间的变量。
- 数值变量(metric variable):取值为数字尺度的变量。


2.数值变量的分类:

  • 离散变量(discrete variable):取值是有限的数值。
  • 连续变量(continuous variable):取值在任意区间内、 或多个区间内是任意值。

3.分类变量的分类:

  • 无序的分类变量(名义(nominal)值分类变量):其取值之间没有顺序关系。
  • 有序的分类变量(顺序(ordinal)值分类变量 / 排序变量):其取值之间具有顺序关系。







数据:(详细内容)

1.分类:

  • 观测数据(observational data):通过调查、或观测收集得到的数据。
  • 实验数据(experimental data):在实验室中控制或干预实验对象所收集得到 的数据。

2.来源:

  • 直接来源:一是来自调查或观察,二是来自实验。
  • 间接来源:主要是公开出版或报道的数据,有些是未公开出版的数据。




抽样方法:(详细内容)
在这里插入图片描述

1.简单随机抽样(Simple Random Sampling):直接从总体单位中随机抽选样本单位,每个个体被选入样本的概率都相等。
最基本的抽样方法

  • 有放回抽样(重复抽样):在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。
  • 无放回抽样(不重复抽样):在一个单位被选入样本后,不再放回总体参与随后的抽样过程。



2.分层抽样(Stratified sampling)(分类抽样):在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取他定数量的元素组成一个样本。


3.系统抽样(Systematic sampling)(等距抽样):先将总体各元素按照某种顺序排列,并按某种规则确定一个随机起点,然后每隔五定的间距抽取一个元素,直到抽取n个元 素组成一个样本。


4.整群抽样(Cluster sampling):先将总体划分为若干群, 然后以群作为抽样单元从中抽取部分群组组成样本,再对抽中的每个群中包含的所有元素进行调查。

最后

以上就是温柔钢笔为你收集整理的33学习笔记——描述统计分析1--变量、数据与抽样方法的全部内容,希望文章能够帮你解决33学习笔记——描述统计分析1--变量、数据与抽样方法所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部