logo
Je teste mes connaissances :
Algorithme Knn

Question n°1

Quelle est la signification de k dans l'algorithme knn ?

>>> Proposition de solution - Proposition de solution - Proposition de solution <<<

Il s'agit de calculer la distance entre une donnée test et l'ensemble des données d'apprentissage.

Puis de trier ces distances par ordre croissant et sélectionner les k plus petites.

Les k données sélectionnées permettent de classifier la donnée test.


Question n°2

Soit un ensemble de 4 données d'apprentissage (d1,d2,d3,d4) avec chacune 2 prédicteurs p et q à valeurs entières et une étiquette pouvant prendre comme valeur "A" ou "B".

Et soit la donnée test de prédicteurs (5,5)

Déterminer l'étiquette de la donnée test en utilisant "à la main" l'algorithme des k plus proche voisins avec k=2 et en utilisant la distance eucidienne.

>>> Proposition de solution - Proposition de solution - Proposition de solution <<<

La distance de la donnée test de prédicteurs (5,5) aux données d'apprentissage donne :

L'algorithme va donc retenir les données d2 et d3 d'étiquettes respectives "A" et "B".

On ne peut donc pas dans ce cas déterminer l'étiquette de notre donnée.

Contribution : Ne pas hésiter à proposer des énoncés d'exercices ... Avec corrections ;)