Меры расстояния для номинальных атрибутов

Меры расстояния для номинальных атрибутов

Многие методы разделение используйте меры расстояния, чтобы определить сходство или различие между любой парой объектов (например, меры расстояния для номинальных атрибутов). Обычно расстояние между двумя экземплярами x_i и x_j обозначается как: d(x_i, x_j). Действительная мера расстояния должна быть симметричной и получать минимальное значение (обычно нулевое) в случае идентичных векторов. Мера расстояния называется метрической мерой расстояния, если она также удовлетворяет следующим свойствам:

Меры расстояния для номинальных атрибутов

Когда атрибуты являются номинальными, можно использовать два основных подхода:

  1. Простая переписка
Меры расстояния для номинальных атрибутов

где p — общее количество атрибутов, а m — количество совпадений.

2. Создание бинарный атрибут для каждого состояния каждого номинального признака и расчет их непохожести.

Делиться
ru_RURU