Medidas de distancia para atributos nominales

Medidas de distancia para atributos nominales

Muchos métodos de fraccionamiento use medidas de distancia para determinar la similitud o diferencia entre cualquier par de objetos (como medidas de distancia para atributos nominales). Es común denotar la distancia entre dos instancias x_i y x_j como: d(x_i, x_j). Una medida de distancia válida debe ser simétrica y obtiene su valor mínimo (normalmente cero) en el caso de vectores idénticos. La medida de distancia se denomina medida de distancia métrica si también satisface las siguientes propiedades:

Medidas de distancia para atributos nominales

Cuando los atributos son nominales, se pueden utilizar dos enfoques principales:

  1. Partido simple
Medidas de distancia para atributos nominales

donde p es el número total de atributos y m es el número de coincidencias.

2. Creando un atributo binario para cada estado de cada atributo nominal y cálculo de su disimilitud.

Compartir, repartir