2.1.3 K Nearest Neighbors Classifier
Algoritma k-nearest neighbor (k-NN atau
KNN) adalah sebuah metode untuk
melakukan klasifikasi terhadap objek berdasarkan data
pembelajaran yang jaraknya paling dekat dengan
objek tersebut.
Data pembelajaran diproyeksikan ke ruang
berdimensi banyak, dimana masing-masing dimensi
merepresentasikan fitur dari data. Ruang ini dibagi
menjadi bagian-bagian berdasarkan klasifikasi data
pembelajaran. Sebuah titik pada ruang ini ditandai
kelas c jika kelas c merupakan klasifikasi yang paling
banyak ditemui pada k buah tetangga terdekat titk
tersebut. Dekat atau jauhnya tetangga biasanya
dihitung berdasarkan jarak Euclidean.