Contenido
PalancaMedidas de distancia para atributos nominales
Muchos métodos de fraccionamiento use medidas de distancia para determinar la similitud o diferencia entre cualquier par de objetos (como medidas de distancia para atributos nominales). Es común denotar la distancia entre dos instancias x_i y x_j como: d(x_i, x_j). Una medida de distancia válida debe ser simétrica y obtiene su valor mínimo (normalmente cero) en el caso de vectores idénticos. La medida de distancia se denomina medida de distancia métrica si también satisface las siguientes propiedades:
Cuando los atributos son nominales, se pueden utilizar dos enfoques principales:
- Partido simple
donde p es el número total de atributos y m es el número de coincidencias.
2. Creando un atributo binario para cada estado de cada atributo nominal y cálculo de su disimilitud.