Mesures de distance pour les attributs nominaux

De nombreuses méthodes de partitionnement utilisent des mesures de distance pour déterminer la similitude ou la dissemblance entre n’importe quelle paire d’objets. Il est courant de désigner la distance entre deux instances x_i et x_j comme: d (x_i, x_j). Une mesure de distance valide doit être symétrique et obtient sa valeur minimale (généralement zéro) dans le cas de vecteurs identiques. La mesure de distance est appelée mesure de distance métrique si elle satisfait également aux propriétés suivantes :

Lorsque les attributs sont nominaux, deux approches principales peuvent être utilisées :

  1. Correspondance simple

où p est le nombre total d’attributs et m est le nombre de correspondances.

2. Création d’un attribut binaire pour chaque état de chaque attribut nominal et calcul de leur dissemblance.