Contenido
PalancaProyecto de modelo de Markov oculto: Terminator
Este proyecto requiere conocimientos de Cadenas de Markov, autómatas y el Modelo Oculto de Markov para realizarlo.
- ¿Hay alguna manera de aprender cosas programáticas en casa, para que puedas parecer… más humano… ya no parecer tan estúpido?
- Mi UPC es un neuroprocesador, una computadora para aprender, cuanto más tengo contacto con los humanos, más aprendo.
- Frio.
Inicio del proyecto
La robótica es un campo de estudio multidisciplinario, que recurre a todas las habilidades y cualidades de las diversas carreras de la ESILV. Los robots se refieren a modelos de comportamiento estocásticos, estos son generalmente autómatas estocásticos como se ve en clase. Pondremos en práctica tus conocimientos para comprender mejor cómo se lleva a cabo un proceso de autoaprendizaje.
Un robot produjo nuevos comportamientos de movimiento en un laberinto. Siendo la primera vez que se encuentra con este tipo de obstáculos, el robot grabó estas diferentes aventuras en el corazón del laberinto para aprender un algoritmo para salir más fácilmente.
El robot indica que el símbolo va directamente a la siguiente pared o intersección; b girando a la derecha; por c dándose la vuelta. Estos son los diferentes caminos que tomó para salir del laberinto (intencionalmente cortos e "ilógicos" pero más fáciles de trabajar a mano):
- Por 1000 intentos en el laberinto
- 500 éxitos en aaba
- 100 éxitos en aabc
- 50 éxitos en aba
- 25 historias de éxito en abc
- 25 historias de éxito en bab
- 75 éxitos en caa
- 200 éxitos en caaab
- 25 casos de éxito en caab
- Algunas acciones siempre han dado lugar a fallos
- C.A
- cb
- CC
- Representa el problema con un árbol prefijos de frecuencia
- Reduzca mediante Merge & Fold y ALERGIA con un alfa de 0.1 (tenga cuidado con las palabras prohibidas). Si el autómata no se reduce, ignore las frecuencias.
- Transforma el autómata reducido en HMM
- Indique las probabilidades de emitir las cadenas de símbolos ac, cb, cc, así como la secuencia de estado oculto más probable de emisión de cada una de las cadenas de símbolos (Backward-Forward y Viterbi). Puedes hacerlo a mano o con sklearn.