scikit-learn的用法(一)???????????????????????????????????????????????????????????
本文主要使用scikit-learn中的KNN算法进行Iris数据集的分类。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
Demo 【scikit-learn的用法(一)???????????????????????????????????????????????????????????】import numpy as np
from sklearn import datasets
from sklearn.cross_validation import train_test_split
from sklearn.neighbors import KNeighborsClassifier
# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
iris_X = iris.data
# 读取分类标签
iris_y = iris.target
# 将数据分为训练、测试两部分
X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size = 0.2)
# 定义分类器
knn = KNeighborsClassifier()
# 进行分类
knn.fit(X_train, y_train)
# 计算预测值
y_predict = knn.predict(X_test)
# 计算准确率, 由于每次数据集划分不同, 可能不一样
print np.sum(np.fabs(y_predict - y_test)) / float(len(y_test))
结果
0.0666666666667
作者:SnailTyan
链接:http://www.jianshu.com/p/5b02bdc2794a
來源:
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
推荐阅读
- 热闹中的孤独
- JAVA(抽象类与接口的区别&重载与重写&内存泄漏)
- 放屁有这三个特征的,请注意啦!这说明你的身体毒素太多
- 一个人的旅行,三亚
- 布丽吉特,人生绝对的赢家
- 慢慢的美丽
- 尽力
- 一个小故事,我的思考。
- 家乡的那条小河
- 《真与假的困惑》???|《真与假的困惑》??? ——致良知是一种伟大的力量