经验法则(也称为68-95-99.7规则或者三西格玛规则)指出正态分布, 我们有以下观察结果:
68%的观测值在平均值附近的1个标准偏差之间:
文章图片
95%的观测值位于平均值附近的两个标准偏差之间:
文章图片
99.7%的观测值在平均值附近的3个标准差之间:
文章图片
以下是一个标准正态分布图, 其中(平均值=0和标准偏差=1), 说明经验法则。
文章图片
【Python统计中的68-95-99.7规则】我们可以使用Python的科学模块。
我们可以使用cdf()的功能scipy.stats.norm计算累积概率(分布曲线下的面积)的模块。
语法:cdf(x, 平均值, SD)参数:x:累积概率将要计算到的值平均值:分布的平均值SD:分布的标准偏差
文章图片
下面是实现:
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm# setting the values of
# mean and S.D.
mean = 0
SD = 1# value of cdf between one, two
# and three S.D. around the mean
one_sd = norm.cdf(SD, mean, SD) - norm.cdf( - SD, mean, SD)
two_sd = norm.cdf( 2 * SD, mean, SD) - norm.cdf( - 2 * SD, mean, SD)
three_sd = norm.cdf( 3 * SD, mean, SD) - norm.cdf( - 3 * SD, mean, SD)# printing the value of fractions
# within each band
print ( "Fracton of values within one SD =" , one_sd)
print ( "Fracton of values within two SD =" , two_sd)
print ( "Fracton of values within three SD =" , three_sd)
输出:
Fracton of values within one SD = 0.6826894921370859
Fracton of values within two SD = 0.9544997361036416
Fracton of values within three SD = 0.9973002039367398
因此, 我们看到值的分数几乎等于0.65, 0.95和0.997。因此, 验证了经验法则。
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。
推荐阅读
- Python3中级主题快速入门
- Python 3基础快速入门介绍
- Python __iter__()和__next__()将对象转换为迭代器
- Python __import__()函数用法介绍
- 毕达哥拉斯四重奏详细介绍
- 毕达哥拉斯定理及其反函数–三角形10级数学
- Pyspark(使用Apache MLlib的线性回归)
- Java多线程中的死锁详细介绍
- 使用reduce操作的金字塔形式(先升后降)连续数组