Ransac|Ransac regressor

Random sample consensus
核心思想:把数据分成inliers 和outliers,选用inliers的数据训练模型。是一种非确定性算法
算法细节

  1. 选择一部分随机样本从原始数据中,并检查数据是否有效。
  2. 使用随机选择的子集训练模型并检查模型是否有效。
  3. 根据模型结果残差 按照residual_threashold分成inliers 和outliers
  4. 保存训练的模型如果inliers样本达到最大
其中1,2步是为了防止一些outliers来训练模型,也可以不要。
收敛条件:
1.达到最大试验次数
2.inliners 数量满足要求
3.所有样本的残差小于阈值
4.训练样本中至少有一次无异常值的样本被抽样
Reference:
【Ransac|Ransac regressor】https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RANSACRegressor.html#sklearn.linear_model.RANSACRegressor

    推荐阅读