Самоорганизованная карта

Самоорганизованная карта

Самоорганизующаяся карта вдохновлена картами объектов нейроны в мозге, состоящем из чувствительных к функциям клеток, которые обеспечивают упорядоченные проекции между нейронными слоями, такие как те, которые могут существовать в сетчатке и улитке. Например, существуют карты акустических признаков, которые реагируют на звуки, которым чаще всего подвергается животное, и тонотопические карты, которые могут отвечать за сохранение порядка акустических резонансов.

Цель обработки информации алгоритма самоорганизующейся карты состоит в том, чтобы оптимально разместить топологию (сетку или решетку) кодов или векторных прототипов в области наблюдаемых выборок входных данных. Первоначально подготавливается случайный пул векторов, который затем подвергается воздействию обучающих выборок. Используется стратегия «победитель получает все», при которой выбирается вектор, наиболее похожий на заданный входной шаблон, а затем выбранный вектор и его соседи обновляются, чтобы они больше походили на входной шаблон.

Повторение этого процесса приводит к распределению векторов кодовой книги во входном пространстве, которое аппроксимирует базовое распределение выборок из набора тестовых данных. Результатом является сопоставление топологии вектора кодовой книги с базовой структурой во входных выборках, которую можно абстрагировать или визуализировать, чтобы выявить топологически сохраненные особенности входного пространства в низкоразмерной проекции.

Самоорганизующаяся карта состоит из набора векторных кодовых книг, связанных друг с другом топологическим расположением, обычно одномерной линией или двумерной сеткой. Сами векторы кодовой книги представляют собой прототипы (точки) в домене, а топологическая структура устанавливает порядок между векторами в процессе обучения. Результатом является низкоразмерная проекция или аппроксимация области проблема которые можно просмотреть или из которых можно извлечь кластеры.

Следующий алгоритм обеспечивает псевдокод для подготовки векторных кодовых книг с использованием метода самоорганизующихся карт. Векторы кодовой книги инициализируются небольшими значениями с плавающей запятой или выбираются из домена. Единица наилучшего соответствия (BMU) — это вектор кодовых книг пула, который имеет минимальное расстояние до входного вектора. Должна быть определена мера расстояния между входными шаблонами. Для векторов с действительными значениями это обычно евклидово расстояние:

самоорганизующаяся карта

где n — количество атрибутов, x — входной вектор, а c — заданный вектор кодовой книги.

Соседи BMU в топологической структуре сети выбираются с использованием размера окрестности, линейно уменьшающегося при обучении сети. Затем BMU и все выбранные соседи корректируются в соответствии с входным вектором с использованием скорости обучения, которая также линейно уменьшается с циклами обучения:

самоорганизующаяся карта

где c_i(t) — i-й атрибут вектора кодовых книг в момент времени t, Learn_rate — текущая скорость обучения, a x_i — i-й атрибут входного вектора.

Окрестность обычно является квадратной (называемой пузырем), где все узлы окрестности обновляются с использованием одной и той же скорости обучения для итерации, или гауссовой, где скорость обучения пропорциональна расстоянию окрестности с использованием гауссовского распределения (соседи, расположенные дальше от BMU, обновляются меньше). ).

самоорганизующаяся карта

Самоорганизующаяся карта (SOM) была разработана для неконтролируемых задач обучения, таких как извлечение признаков, визуализация и кластеризация. Некоторые расширения подхода могут маркировать подготовленные векторы кодовой книги, которые можно использовать для классификации. SOM является непараметрическим, что означает, что он не полагается на предположения о структуре функции, которую он аппроксимирует. Реальные значения во входных векторах должны быть нормализованы таким образом, чтобы x находился в [0; 1].

Евклидово расстояние обычно используется для измерения расстояния между векторами с действительными значениями, хотя могут использоваться и другие меры расстояния (например, скалярное произведение), а для атрибутов, а не скаляров, могут потребоваться меры расстояния для конкретных данных.

Должно быть достаточно итераций обучения, чтобы несколько раз предоставить модели все обучающие данные. Чем сложнее распределение классов, тем больше потребуется векторов кодовой книги, для некоторых задач могут потребоваться тысячи. Несколько проходов алгоритма обучения SOM предлагаются для более надежного использования, где первый проход имеет высокую скорость обучения для подготовки векторов кодовой книги, а второй проход имеет низкую скорость обучения и выполняется в течение длительного периода (возможно, в 10 раз больше итераций). .

SOM можно визуализировать путем расчета унифицированной матрицы расстояний (U-Matrix), которая выделяет отношения между узлами в выбранной топологии. Анализ главных компонентов (PCA) или картирование Саммона можно использовать для визуализации только сетевых узлов без их взаимосвязей.

Для SOM обычно используется топология прямоугольной двумерной сетки, хотя могут использоваться как тороидальная, так и сферическая топологии. Шестиугольные сетки лучше полученные результаты на некоторых задачах и сетках более высоких размерностей.

Позиции нейронов могут обновляться постепенно или в пакетном режиме (каждая эпоха подвергается воздействию всех обучающих выборок). Пакетное обучение обычно должно приводить к более стабильной сети.

Скорость обучения и параметры соседства обычно уменьшаются линейно с итерациями обучения, хотя можно использовать нелинейные функции.

Делиться
ru_RURU
%d такие блоггеры, как: