Medidas de distancia para atributos nominales

Medidas de distancia para atributos nominales

Muchos métodos de partición utilizan medidas de distancia para determinar la similitud o disimilitud entre cualquier par de objetos (como medidas de distancia para atributos nominales). Es común designar la distancia entre dos instancias x_i y x_j como: d (x_i, x_j). Una medición de distancia válida debe ser simétrica y obtener su valor mínimo (generalmente cero) en el caso de vectores idénticos. La medida de distancia se denomina medida de distancia métrica si también satisface las siguientes propiedades:

Medidas de distancia para atributos nominales

Cuando los atributos son nominales, se pueden utilizar dos enfoques principales:

  1. Partido simple
Medidas de distancia para atributos nominales

donde p es el número total de atributos y m es el número de coincidencias.

2. Creación de un atributo binario para cada estado de cada atributo nominal y cálculo de su disimilitud.

Compartir, repartir
es_ESES
A los bloggers de %d les gusta esto: