概率统计

抽样分布

  • 总体:是指研究对象的整个群体。
  • 样本:是从总体中选取的一部分,用于代表总体的整体情况。
  • 样本数量:又叫样本空间,是表示有多少个样本。
  • 样本大小:及样本的容量,表示每个样本里有多少个数据。
  • 抽样分布:将样本平均值可视化,叫做抽样分布。
  • 样本均值:一个样本中所有数据的平均值,\(\overline{x}\)。
  • 总体均值:要研究的总体中所有数据的平均值,\( \mu \)。
抽样方法
  • 简单随机抽样: 随机选取一个大小为n的样本,所有大小为n的可能样本被抽取的可能性相同,包括重复抽样和不重复抽样,具体方式有抽签或使用随机编号生成器。
  • 分层抽样:将总体分为几个单位相似的层,层与层之间尽可能不一样,分好层后对每一层进行简单随机抽样。
  • 整群抽样:将总体划分为几个群,其中每个群都尽量与其他群相似,可通过简单随机抽样抽取几个群,然后用抽取的群形成样本。
  • 系统抽样:选取一个数字K,然后每到第K个数据时就抽样一次。
中心极限定理 在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于标准正态分布。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。
如何用样本来估计总体
  • 均值参数
    利用中心极限定理我们可以用样本估计出总体的平均值,样本均值约等于总体均值。
【概率统计】概率统计
文章图片

    推荐阅读