Mesures de distance pour les attributs ordinaux

Mesures de distance pour les attributs ordinaux

De nombreuses méthodes de partitionnement utilisent des mesures de distance pour déterminer la similitude ou la dissemblance entre n’importe quelle paire d’objets (comme Mesures de distance pour les attributs ordinaux). Il est courant de désigner la distance entre deux instances x_i et x_j comme: d (x_i, x_j). Une mesure de distance valide doit être symétrique et obtient sa valeur minimale (généralement zéro) dans le cas de vecteurs identiques. La mesure de distance est appelée mesure de distance métrique si elle satisfait également aux propriétés suivantes :

Mesures de distance pour les attributs ordinaux

Lorsque les attributs sont ordinaux, la séquence des valeurs est importante. Dans de tels cas, les attributs peuvent être traités comme des attributs numériques après avoir mappé leur plage sur [0,1]. Cette cartographie peut être effectuée comme suit:

Mesures de distance pour les attributs ordinaux

où z_i, n est la valeur normalisée de l’attribut a_n de l’objet i. r_i, n est cette valeur avant normalisation, et M_n est la limite supérieure du domaine de l’attribut a_n (en supposant que la limite inférieure est 1).