概述
对于这个不部分的理解总是有一些不确定,所以运用起来除了记公式,套模型,几乎不能够引申理解。
看了一遍最基本的定义,发现非常的简洁易懂。摘录+理解如下。
在概率论章节,我们对一个变量的分布模型是已经知道的,带着这个模型再去研究或者说计算相应的性质,数字特征等。
但是在数理统计这部分,事情的切入角度是不一样的:研究的随机变量分布是不知道的,但是我们常常需要通过一些手段来推断这个随机变量的分布。这个手段是:多次独立重复的观察,得到一些观察值。根据这些观察值,我们就可以对此变量的分布做一个合理的推断。
首先看我们需要研究什么。比如想调查某校的学生身高,身高这个数量指标就是研究对象。全校学生的身高值是随机变量,不妨设为X,变量对应有取值范围,这里的范围就是全校学生的身高取值。X就是总体,也称之为总体X。特别强调总体X是一个随机变量,表达的是所有的取值。总体又分为有限整体还有无限整体。研究一个学校学生的身高,自然是有限整体。如果对象是全国正在使用的某种型号灯的寿命,观察值个数很多,可以认为是无限整体。
总体的分布是未知的,它具有某种形式是可以建模的,其次,模型中含有着未知参数,这个参数将通过抽样的方式做出推断。
被抽出的部分个体就叫做总体的一个样本。
从整体抽出一个个体,就是对总体X进行一次观察并记录结果。在相同条件下对总体进行n次独立重复观察。将n次观察结果按照试验顺序记为 X1,X2,..,Xn 。它们是相互独立的,且都是与X具有相同分布的随机变量。 X1,X2,..,Xn 称之为来自总体X的一个简单随机样本。
特别需要理解的是:样本中的每一个取值我们也视作随机变量,因为抽样的随机性,因此每一个个体都是对总体的反应,所以和总体X是平级的,比如总体X的取值范围,在每一个个体上,取值范围也是相同的。
对于抽取的样本,可以具体得到观察值 x1,x2,...,xn ,称之为样本值。
抽取过程还分为有放回和无放回抽样。放回抽样用起来不方便,因此近似用不放回抽样代替。当然无限总体二者没有差别,谈不上近似。
严格定义:设X是具有分布函数F的随机变量,若 X1,X2,..,Xn 是具有同一分布函数F,相互独立的随机变量,则称 X1,X2,..,Xn 是从分布函数F(或称总体F,或者总体X)得到的容量为n的简单随机样本,简称样本。观察值 x1,x2,...,xn 称为样本值,也成为X的n个独立的观察值。
则: F∗(x1,x2,...,xn)=∏ni=1F(xi)
若X具有概率密度 f ,则:
举一个例子:设总体X的概率密度是
来自总体X的样本为 X1,X2,X3,X4 ,则 X(4)=max(X1,X2,X3,X4) 的概率密度 fX(4)(x)=?
分析:从概率分布角度看更容易解释。
而
从而
fX(4)(x)=,
最后
以上就是认真紫菜为你收集整理的总体与样本的理解的全部内容,希望文章能够帮你解决总体与样本的理解所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复