pythonols函数 python中iloc函数

统计学ols方法的原理普通最小二乘法(OLS)方法的原理是:
利用最小二乘法可以简便地求得未知的数据,并使得所选择的回归模型应该使所有观察值的残差平方和达到最小 。具体验证如下:
样本回归模型:
其中ei为样本(Xi,Yi)的误差 。
平方损失函数:
则通过Q最小确定这条直线,即确定β0和β1,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到 。求Q对两个待估参数的偏导数:
根据数学知识我们知道,函数的极值点为偏导为0的点 。
解得:
这就是最小二乘法的解法,就是求得平方损失函数的极值点 。
扩展资料
最小二乘法来源于19世纪意大利天文学家朱赛普·皮亚齐的一次发现 , 后由勒让德或高斯发明 。
1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星 。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置 。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星 , 但是根据大多数人计算的结果来寻找谷神星都没有结果 。
时年24岁的高斯也计算了谷神星的轨道 。奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星 。
高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中 。
法国科学家勒让德于1806年独立发明“最小二乘法”,但因不为世人所知而默默无闻 。
勒让德曾与高斯为谁最早创立最小二乘法原理发生争执 。
1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明 , 因此被称为高斯-马尔可夫定理 。
参考资料来源:百度百科-最小二乘法
强烈推荐一款Python可视化神器!强烈必备!Plotly Express 是一个新的高级 Python 可视化库:它是 Plotly.py 的高级封装,它为复杂的图表提供了一个简单的语法 。
受 Seaborn 和 ggplot2 的启发,它专门设计为具有简洁,一致且易于学习的 API :只需一次导入,您就可以在一个函数调用中创建丰富的交互式绘图,包括分面绘图(faceting)、地图、动画和趋势线 。它带有数据集、颜色面板和主题,就像 Plotly.py 一样 。
Plotly Express 完全免费:凭借其宽松的开源 MIT 许可证 , 您可以随意使用它(是的 , 甚至在商业产品中?。?。
最重要的是,Plotly Express 与 Plotly 生态系统的其他部分完全兼容:在您的 Dash 应用程序中使用它,使用 Orca 将您的数据导出为几乎任何文件格式,或使用JupyterLab 图表编辑器在 GUI 中编辑它们!
用 pip install plotly_express 命令可以安装 Plotly Express 。
一旦导入Plotly Express(通常是 px ),大多数绘图只需要一个函数调用,接受一个整洁的Pandas dataframe , 并简单描述你想要制作的图 。如果你想要一个基本的散点图,它只是 px.scatter(data,x =“column_name”,y =“column_name”) 。
以下是内置的 Gapminder 数据集的示例,显示2007年按国家/地区的人均预期寿命和人均GDP 之间的趋势:
如果你想通过大陆区分它们,你可以使用 color 参数为你的点着色 , 由 px 负责设置默认颜色 , 设置图例等:
这里的每一点都是一个国家,所以也许我们想要按国家人口来衡量这些点...... 没问题:这里也有一个参数来设置,它被称为 size:
如果你好奇哪个国家对应哪个点? 可以添加一个 hover_name ,您可以轻松识别任何一点:只需将鼠标放在您感兴趣的点上即可! 事实上,即使没有 hover_name ,整个图表也是互动的:

推荐阅读