智能钻完井|pyhton_基尼指数计算

1.定义:基尼指数(基尼不纯度):表示在样本集合中一个随机选中的样本被分错的概率。
注意: Gini指数越小表示集合中被选中的样本被分错的概率越小,也就是说集合的纯度越高,反之,集合越不纯。

def gini_index_single(a,b): single_gini = 1 - ((a/(a+b))**2) - ((b/(a+b))**2) return round(single_gini,4)# 求取基尼指数 def gini_index(a,b,c,d,e,f): zuo = gini_index_single(a,b) zhong = gini_index_single(c,d) you = gini_index_single(e,f) sum = a+b+c+d+e+f gini_index = zuo*((a+b)/sum) + zhong*((c+d)/sum) + you*((e+f)/sum) return round(gini_index,4) def gini_index2(a,b,c,d): zuo = gini_index_single(a,b) you = gini_index_single(c,d) sum = a+b+c+d gini_index2 = zuo*((a+b)/sum) + you*((c+d)/sum) return round(gini_index2,4)def gini_index3(a,b): zuo = gini_index_single(a,b)sum = a+b gini_index2 = zuo*((a+b)/sum) return round(gini_index2,4)

【智能钻完井|pyhton_基尼指数计算】作者:WangB

    推荐阅读