怎么在python中使用sklearn实现一个资讯分类算法?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
实现步骤:通过选取与该点距离最近的k个样本,在这k个样本中哪一个类别的数量多,就把k归为哪一类。
注意
- <李>
该算法需要保存训练集的观察值,以此判定待分类数据属于哪一类
李> <李>k需要进行自定义,一般选取k<30
李> <李>距离一般用欧氏距离,即, # #,导入鸢尾花数据集
时间=iris datasets.load_iris ()
时间=data iris.data [:,: 2]
target =iris.target
# #,区分训练集和测试集,75%的训练集和25%的测试集
train_data, test_data =, train_test_split (np.c_[数据,目标])
# #,训练并预测,其中选取k=15
时间=clf neighbors.KNeighborsClassifier(15日,& # 39;距离# 39;)
clf.fit (train_data (:,: 2), train_data[2]:也)
时间=Z clf.predict (test_data [:,: 2])
print & # 39;准确率:& # 39;,,clf.score (test_data (:,: 2), test_data[2]:也)
时间=colormap dict (zip (np.unique(目标),sns.color_palette () [3]))
plt.scatter (train_data (:,, 0), train_data:,, 1,, edgecolors=[colormap [x], for x 拷贝train_data [:,, 2]], c=& # 39; & # 39;,,=80,,标签=& # 39;all_data& # 39;)
plt.scatter (test_data (:,, 0), test_data:,, 1,,标志=& # 39;^ & # 39;,,颜色=[colormap [x], for x 拷贝Z],,=20,,标签=& # 39;test_data& # 39;)
普特传奇()
plt.show ()
结果如下:
关于怎么在python中使用sklearn实现一个资讯分类算法问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。