Меры расстояния для порядковых атрибутов

Меры расстояния для порядковых атрибутов

Многие методы разделение используйте меры расстояния, чтобы определить сходство или различие между любой парой объектов (например, меры расстояния для порядковых атрибутов). Обычно расстояние между двумя экземплярами x_i и x_j обозначается как: d(x_i, x_j). Действительная мера расстояния должна быть симметричной и получать минимальное значение (обычно нулевое) в случае идентичных векторов. Мера расстояния называется метрической мерой расстояния, если она также удовлетворяет следующим свойствам:

Меры расстояния для порядковых атрибутов

Когда атрибуты порядковые, важна последовательность значений. В таких случаях атрибуты могут рассматриваться как числовые атрибуты после сопоставления их диапазона с [0,1]. Это отображение можно сделать следующим образом:

Меры расстояния для порядковых атрибутов

где z_i, n — нормализованное значение атрибута a_n объекта i. r_i, n — это значение до нормализации, а M_n — верхняя граница домена атрибута a_n (при условии, что нижняя граница равна 1).

Делиться
ru_RURU