Меры расстояния для порядковых атрибутов
Многие методы разделение используйте меры расстояния, чтобы определить сходство или различие между любой парой объектов (например, меры расстояния для порядковых атрибутов). Обычно расстояние между двумя экземплярами x_i и x_j обозначается как: d(x_i, x_j). Действительная мера расстояния должна быть симметричной и получать минимальное значение (обычно нулевое) в случае идентичных векторов. Мера расстояния называется метрической мерой расстояния, если она также удовлетворяет следующим свойствам:

Когда атрибуты порядковые, важна последовательность значений. В таких случаях атрибуты могут рассматриваться как числовые атрибуты после сопоставления их диапазона с [0,1]. Это отображение можно сделать следующим образом:

где z_i, n — нормализованное значение атрибута a_n объекта i. r_i, n — это значение до нормализации, а M_n — верхняя граница домена атрибута a_n (при условии, что нижняя граница равна 1).