Aprendizaje de la cuantificación de vectores: sistemas complejos e inteligencia artificial

Contenido

Algoritmo de aprendizaje de cuantización vectorial

El aprendizaje de la cuantización vectorial está vinculado al mapa de autoorganización que, a su vez, está inspirado en las habilidades de autoorganización de neuronas en la corteza visual.

El objetivo de procesamiento de información del algoritmo de aprendizaje de cuantificación vectorial es preparar un conjunto de libros de códigos vectoriales (o prototipo) en el dominio de muestras de datos de entrada observados y utilizar estos vectores para clasificar ejemplos no tratados. Se prepara inicialmente un grupo aleatorio de vectores que luego se expone a muestras de entrenamiento.

Se utiliza una estrategia ganadora se lleva todo donde uno o más de los vectores más similares a un patrón de entrada determinado se seleccionan y ajustan para estar más cerca del vector de entrada y, en algunos casos, más lejos del ganador para los finalistas. La repetición de este proceso da como resultado la distribución de vectores de libro de códigos en el espacio de entrada que se aproxima a la distribución subyacente de muestras del conjunto de datos de prueba.

El algoritmo de aprendizaje de cuantificación vectorial es una técnica de procesamiento de señales en la que las funciones de densidad se aproximan con vectores prototipo para aplicaciones como la compresión. El aprendizaje de la cuantificación de vectores es similar en principio, aunque los vectores prototipo se aprenden mediante un método supervisado en el que el ganador se lo lleva todo.

El siguiente algoritmo proporciona una pseudocódigo preparar libros de códigos vectoriales utilizando el método de aprendizaje de cuantificación vectorial. Los vectores de libro de códigos se inicializan a pequeños valores de punto flotante o se muestrean de un conjunto de datos disponible. La unidad de mejor coincidencia (BMU) es el vector de libros de códigos del grupo que tiene la distancia mínima a un vector de entrada. Se debe definir una medida de distancia entre patrones de entrada. Para vectores de valores reales, esta suele ser la distancia euclidiana:

donde n es el número de atributos, x es el vector de entrada y c es un vector de libros de códigos dado.

La cuantificación de los vectores de aprendizaje se diseñó para problemas de clasificación que contienen conjuntos de datos existentes que pueden usarse para supervisar el aprendizaje por parte del sistema. El algoritmo no soporta problemas de regresión. LVQ no es paramétrico, lo que significa que no se basa en suposiciones sobre la estructura de la función a la que se aproxima. Los valores reales en los vectores de entrada deben normalizarse de manera que x esté en [0; 1].

La distancia euclidiana se usa comúnmente para medir la distancia entre vectores de valores reales, aunque se pueden usar otras medidas de distancia (como el producto escalar) y se pueden requerir medidas de distancia específicas de datos para atributos no escalares. Debe haber suficientes iteraciones de entrenamiento para exponer todos los datos de entrenamiento al modelo varias veces. La tasa de aprendizaje suele disminuir linealmente durante el período de aprendizaje a partir de un valor inicial cercano a cero. Cuanto más compleja sea la distribución de clases, más vectores de libro de códigos se necesitarán, algunos problemas pueden requerir miles.

Se sugieren varias pasadas del algoritmo de entrenamiento LVQ para un uso más robusto, donde la primera pasada tiene una tasa de aprendizaje alta para preparar los vectores del libro de códigos y la segunda pasada tiene una tasa de aprendizaje baja y se ejecuta durante un período prolongado (quizás 10 veces más iteraciones) .