总体和样本 在数理统计中,不是对所研究的对象全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.
总体 对随机试验的某一数量指标进行试验或观察:
- 试验的全部可能的观察值称为总体
- 每一个可能观察值称为个体
- 总体中所包含的个体的个数称为总体的容量
- 总体中的每一个个体是随机试验的一个观察值,因此它是某一随机变量X 的值
- 一个总体对应一个随机变量X
- 不再区分总体和相应的随机变量,统称为总体X
- X 的分布函数和数字特征称为总体的分布函数和数字特征
- 总体分布一般是未知,或只知道是包含未知参数的分布。
- 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”。
- 所抽取的部分个体称为样本。
- 样本中所包含的个体数目称为样本容量。
文章图片
。这样得到的随机样本
文章图片
是来自总体X的一个简单随机样本,与总体随机变量具有相同的分布。n称为这个样本的容量。
一旦取定一组样本
文章图片
,得到n个具体的数值
文章图片
,称为样本的一次观察值,简称样本值 。
最常用的一种抽样叫作“简单随机抽样”,其特点:
- 代表性:
文章图片
中每一个与所考察的总体有相同的分布. - 独立性:
文章图片
是相互独立的随机变量.
文章图片
统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.
若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为
文章图片
其简单随机样本的联合概率密度函数为
文章图片
抽样分布 统计量与经验分布函数
统计量
由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.
这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.
设
文章图片
是来自总体X的一个样本,
文章图片
是
文章图片
的函数,若g中不含未知参数,则
文章图片
是样本的一个统计量。
-
文章图片
是样本,也是随机变量 - 统计量是随机变量的函数,故也是随机变量
-
文章图片
是统计量
文章图片
的观察值。
样本平均值:
文章图片
(它反映了 总体均值 的信息)
样本方差:
文章图片
(它反映了总体 方差的信息)
样本标准差 :
文章图片
样本k阶原点矩:
文章图片
(它反映了总体k 阶矩的信息)
样本k阶中心矩:
文章图片
(它反映了总体k 阶 中心矩的信息)
注意:
文章图片
统计量的观察值
文章图片
文章图片
文章图片
文章图片
文章图片
仍分别称为样本均值、样本方差、样本标准差、样本 k 阶(原点)矩以及样本 k 阶中心矩。
统计量的一些性质
设总体X的均值为
文章图片
,方差为
文章图片
,
文章图片
是来自总体X的一个样本,则
-
文章图片
-
文章图片
-
文章图片
- 若总体X的k阶矩
文章图片
存在,则
文章图片
(矩估计法的理论根据)
设
文章图片
是来自总体F的一个样本,用
文章图片
,表示
文章图片
中不大于x的随机变量的个数
定义:经验分布函数为
文章图片
正态总体的三个常用抽样分布
- 统计量的分布称为抽样分布
- 总体分布已知时,抽样分布虽然是确定的,但一般来说难以求得
- 正态总体的三个常用抽样分布:
-
文章图片
分布 -
文章图片
分布 -
文章图片
分布
-
文章图片
分布
文章图片
分布是由正态分布派生出来的一种分布.
定义:设
文章图片
相互独立,都服从正态分布
文章图片
,则称随机变量:
文章图片
所服从的分布为自由度为 n 的
文章图片
分布。记为
文章图片
文章图片
文章图片
分布的性质
- ???????设
文章图片
相互独立,都服从正态分布
文章图片
,则
文章图片
- 设
文章图片
,且
文章图片
相互独立,则
文章图片
,这个性质叫
文章图片
分布的可加性. - 若
文章图片
,
文章图片
分布的数学期望和方差
文章图片
文章图片
T分布
定义:设
文章图片
,
文章图片
, 且X与Y相互独立,则称变量
文章图片
所服从的分布为自由度为 n的 T分布,记为
文章图片
。T分布又称为学生氏分布,它的概率密度函数为:
文章图片
文章图片
T分布的性质
- T分布的密度函数关于
文章图片
对称,当n充分大时,妻徒刑近似于标准正态分布概率密度函数的图形,再由
文章图片
函数的性质有
文章图片
,即当n足够大时,
文章图片
-
文章图片
-
文章图片
时,
文章图片
设
文章图片
,U与V相互独立,则称随机变量
文章图片
服从自由度为n1及 n2的F分布,n1称为第一自由度,n2称为第二自由度,记作
文章图片
。
文章图片
【笔记|概率 + 统计 样本及抽样分布(六)】
文章图片
F分布的性质
- 若
文章图片
,则
文章图片
-
文章图片
设
文章图片
是来自正太总体
文章图片
的样本,
文章图片
是样本均值,则有
文章图片
,即
文章图片
n取不同值时样本均值
文章图片
的分布
文章图片
定理 2(样本方差的分布)
设
文章图片
是来自正太总体
文章图片
的样本,
文章图片
和
文章图片
分别是样本均值和样本方差,则有
-
文章图片
-
文章图片
与
文章图片
独立
文章图片
的分布见右图
文章图片
定理 3 (样本均值方差比的分布)
设
文章图片
是来自正太总体
文章图片
的样本,
文章图片
和
文章图片
分别是样本均值和样本方差,则有
文章图片
定理 4 (两总体样本均值差、样本方差比的分布)
设
文章图片
,且X与Y独立,
文章图片
是来自X的样本,
文章图片
是来自Y的样本,
文章图片
和
文章图片
分别是这两个样本的样本均值,
文章图片
和
文章图片
分别是这两个样本的样本方差,则有
-
文章图片
- 若
文章图片
文章图片
推荐阅读
- 笔记|打印dataframe数据的几种方法
- 笔记|原生HTML,CSS,JS实现tab栏切换效果
- 笔记|哈工大机器学习Week2知识点总结
- 机器学习|机器学习(七)过拟合问题与正则化
- 笔记|Verilog 语法task和function不可以使用initial和always
- 笔记|AppWeb 身份验证绕过漏洞 (CVE-2018-8715)复现实验报告
- 笔记|Cobalt strike 派生shell给MSF
- 笔记|初步认识机器学习(Machine Leaning)
- 学习|Python3学习