三、抽样与参数估计

抽样与抽样分布 一、概率抽样方法:
随机抽样:从含有N个元素的总体中,抽取n个元素作为样本,使得每一个客量为n的样本都有相同的机会被抽中。
重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止
不重复抽样:一个元素被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直到抽取n个元素为止。
分层抽样:在抽样之前先将总体的元素划分为若干层,然后从各层取一定数量的元素组成一个样本。
分层:使层内各元素的差异尽可能小,层与层之间的差异尽可能大。
优点:
1、分层抽样除了可以对总体进行估计外,还可以对各层的子总体进行估计
2、按自然区域或者行政区域进行分层,这样抽样的组织和实施都比较方便
3、样本分布在各层内,从而使样本在总体的分布比较均匀
4、分层抽样可以提高估计的精度
eg:
共有1500人,会计500人、金融350人、市场营销35人、营销管理30人、信息系统30人抽取180作为样本
180/1500*500
350/1500*500
...
系统抽样:先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定间隔抽取一个元素,直至抽取n元素形成一个样本。
整体抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,在对抽中的各个群中所包含的所有元素进行观察。
参数估计的基本原理: 一、估计量和估计值:
估计值:估计总体参数时计算出来的估计量的具体数值。
估计量:用来估计总体参数的统计量的名称。
二、点估计与区间估计:
点估计:用样本估计量的值作为总体参数的估计量,样本平均值估计总体估计值;样本方差估计总体方差等。
区间估计:在点的基础上,给出总体参数估计的一个范围。样本统计量加减抽样误差而得到的。三、抽样与参数估计
文章图片

置信区间:由样本统计量所构造的总体参数的估计区间,其中区间最小值称为置信下限,最大值称为置信上限
比如,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,称95%这个值被称为置信水平
置信水平/置信系数:将构造置信区间的步骤重复多次,置信区间中包含总体参数真值得次数所占得比率。
【三、抽样与参数估计】三、抽样与参数估计
文章图片

总体均值的区间估计 估计误差:大样本(n>=30),小样本(n<30)。一是点估计量的标准误差,取决于样本统计量的抽样分布;二是置信水平为1-α时,统计量分布两侧面积各为α/2时的分位数值。因此,总体均值在1-α置信水平下的置信区间可表示:
x±(分位数值*x-bar的标准误差)
一、大样本的估计
由中心极限定理,正态分布构建总体均值在1-α置信水平下的置信区间α是事先确定的概率值,它是总体均值不包括在置信区间的概率,
三、抽样与参数估计
文章图片

x表示样本的均值,z值表示有多少标准差,s 为样本的标准差。
1.645–》 excel [NORM.S.INV] 正态分布函数值
39.5 --》 excel [average] 均值
7.77 --》excel [stdev] 标准差
样本量的确定 一、估计总体均值时样本量的确定
总体均值的置信区间是由样本均值x和估计误差两部分组成的。在重复抽样或无限总体抽样条件下,估计误差为:
三、抽样与参数估计
文章图片

其中zα/2的值和样本n共同确定了估计误差的大小。当确定了置信水平1-α,zα/2的值就确定了。对于给定的zα/2的值和总体标准差σ,就可以确定任一希望的估计误差所需要的样本量。令E代表所希望达到的估计误差,即:
三、抽样与参数估计
文章图片

通过上式可以推导出确定样本量的公式如下
三、抽样与参数估计
文章图片

例:
三、抽样与参数估计
文章图片

二、估计总体比例时样本量的确定
与估计总体均值时样本量确定的方法类似,在重复抽样或无限总体抽样条件下,估计总体比例置信区间的估计误差为:
三、抽样与参数估计
文章图片

由上式可知,zα/2的值、总体比例π和样本量n共同确定了估计误差的大小。令E代表所希望达到的估计误差,即:
三、抽样与参数估计
文章图片

据此可以推导出重复抽样或无限总体抽样条件下确定样本量的公式如下:
三、抽样与参数估计
文章图片

三、抽样与参数估计
文章图片

总结: 1、抽样分布是参数估计中的一个重要概念,是抽样估计的基础
抽样分布是指样本统计量的分布,样本均值分布、样本比例分布
2、参数估计的方法有点估计和区间估计
区间估计是在点估计的基础上,给出总体参数的一个置信区间,并给出总体参数在这一区间的概率,实际应用区间估计
3、总体均值的区间由样本均值x-bar和估计误差两部分组成
①当总体服从正态分布且方差已知,当我们从一个已知方差σ2 的正态分布总体中抽样时,总体均值μ的一个(1-α)%置信区间为:
三、抽样与参数估计
文章图片

②大样本,样本方差未知,当我们从一个方差未知的正态分布总体中抽样且所抽取的样本是大样本时,总体均值μ的一个(1-α)%置信区间为:
三、抽样与参数估计
文章图片

③总体方差未知,t分布(t-distribution)。如果我们从一个方差未知的总体中抽样并且满足下面两个条件之一时,
i.样本是大样本;
ii.样本是小样本但是总体服从正态分布,或者近似正态分布。
那么,总体均值μ的一个(1-α)%置信区间为:
三、抽样与参数估计
文章图片

tα/2 的自由度数值为n-1,n是样本容量
4、确定样本量,
①在估计总体均值时,样本量的确定公式是:
三、抽样与参数估计
文章图片

②在估计总体比例时,样本量的确定公式是:

三、抽样与参数估计
文章图片

    推荐阅读