Différentes mesure de distance existent :
- La distance de Manhattan :
- La distance euclidienne :
- La distance de Minkowski :
- ...
Ces distances ne sont pas adapatées aux données nominatives.
- La distance de Hamming : nombre de composantes différentes entre deux données
Exemple :
Hamming((jeune, myope, oui, normal),(jeune, myope, oui, normal)) = 0
Hamming((jeune, myope, oui, normal),(jeune, hypermétrope, oui, normal)) = 1
Hamming((jeune, myope, oui, normal),(presbyte, hypermétrope, non, réduit)) = 4