分类算法之邻近算法:KNN（应用篇）

zilu 发布于2019-07-31 11:02 / 566人阅读

摘要：起步这次使用的训练集由模块提供，关于虹膜一种鸢尾属植物的数据。它的品种分类有山鸢尾，变色鸢尾，菖蒲锦葵三种。构造分类器参数级是指定获取个邻近点。训练训练的函数一般就是测试模拟一些测试数据，使用刚刚的模型进行预测

起步

这次使用的训练集由 sklearn 模块提供，关于虹膜（一种鸢尾属植物）的数据。

数据载入

from sklearn import datasets
iris = datasets.load_iris()

数据存储在 .data 成员中，它是一个 (n_samples, n_features) numpy 数组：

print(iris.data)
# [[ 5.1  3.5  1.4  0.2]
#  [ 4.9  3.   1.4  0.2]
#  ...

它有四个特征，萼片长度，萼片宽度，花瓣长度，花瓣宽度 (sepal length, sepal width, petal length and petal width）。

它的品种分类有山鸢尾，变色鸢尾，菖蒲锦葵（Iris setosa, Iris versicolor, Iris virginica.）三种。

print iris.data.shape
# output:(150L, 4L)

这是一个含有 150 个数据的训练集。

构造 KNN 分类器

from sklearn import neighbors
knn = neighbors.KNeighborsClassifier(n_neighbors=5)

n_neighbors 参数级是指定获取 K 个邻近点。

训练

训练的函数一般就是 fit ：

knn.fit(iris.data, iris.target)

测试

模拟一些测试数据，使用刚刚的模型进行预测：

predict = knn.predict([[0.1, 0.2, 0.3, 0.4]])
print(predict) # output: [0]

GPU云服务器云服务器分类算法自然分类算法最新分类算法图像识别算法分类

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/44539.html

从零开始构造邻近分类器KNN

摘要：起步本章介绍如何自行构造分类器，这个分类器的实现上算是比较简单的了。不过这可能需要你之前阅读过这方面的知识。在预测函数中，需要依次计算测试样本与数据集中每个样本的距离。筛选出前个，采用多数表决的方式。测试还是使用中提供的虹膜数据。起步本章介绍如何自行构造 KNN 分类器，这个分类器的实现上算是比较简单的了。不过这可能需要你之前阅读过这方面的知识。前置阅读分类算法之邻近算法:KN...

GeekQiaQia 2019-07-30 15:15 评论0 收藏0
k-邻近算法（kNN）

摘要：邻近算法算法背景假设我们要给一堆音乐分类，我们可以分成摇滚，民谣，戏曲等等，摇滚的音乐激昂，节奏快。这种基于某一特征出现的次数来区分事物的算法，我们使用邻近算法。 k-邻近算法算法背景假设我们要给一堆mp3音乐分类，我们可以分成摇滚，民谣，戏曲等等，摇滚的音乐激昂，节奏快。民谣舒缓节奏慢，但是摇滚中也有可能存在舒缓节奏慢点旋律，同理民谣中也会有激昂，快的旋律。那么如何区分他们呢，...

william 2019-07-30 14:41 评论0 收藏0