Внутренние критерии качества

Внутренние критерии качества

Внутренние критерии качества (критерий Кондорсе, критерий C, метрика полезности категории, меры сокращения) обычно измеряют компактность кластера с использованием меры подобия. Обычно он измеряет внутрикластерную однородность, межкластерную разделимость или их комбинацию. Он не использует внешнюю информацию наряду с самими данными. Вот четыре внутренних критерия качества.

Критерий Кондорсе

Другой подходящий подход — применить решение Кондорсе к проблеме ранжирования. В этом случае критерий рассчитывается следующим образом:

внутренние критерии качества критерий Кондорсе

где s (x_j, x_k) и d (x_j, x_k) измеряют сходство и расстояние между векторами x_j и x_k.

Критерий С

Критерий C является расширением критерия Кондорсе и определяется как (где γ - пороговое значение):

критерий внутренних критериев качества C

Метрика полезности категории

Полезность категории определяется как увеличение ожидаемого количества значений признаков, которые можно правильно предсказать с учетом определенной кластеризации. Эта метрика полезна для задач, содержащих относительно небольшое количество номинальных функций, каждая из которых имеет небольшую мощность.

Размеры резки

В некоторых случаях полезно представить задачу кластеризация как минимальная задача резки. В таких случаях качество измеряется как отношение остаточного веса к общему весу нарезки. Если нет ограничений на размер кластеров, найти оптимальное значение несложно. Таким образом, мера минимального сокращения пересматривается, чтобы наказывать несбалансированные конструкции.

Делиться
ru_RURU
%d такие блоггеры, как: