Árbol decisión:
- ID3
- C4.5
- IR
- CARRO
- ID2de3
- C5.0T
- AGOSTO
- SP-Lima
- k-lima
- Fusión de árboles
- Extracto del árbol de decisión
- Árbol de decisión suave
Reglas de decisión:
Medición de la calidad de la regla:
- Redes bayesianas ingenuas
- Redes bayesianas
- Análisis discriminante lineal
- Bayesiano asintótico factorizado
- Or bayesiano de la BOA de And
- ORCO
- Reglas booleanas de dos niveles
- DELGADO
- TILM
- PILM
- RiesgoSLIM
- Reglas ordenadas para la clasificación
- Máquina de listas bayesianas BLM
- Lista de reglas bayesianas BRL
- (S)BRL
- Listas de reglas descendentes FRL
- CPAR
- CEREBRO
- A TRAVÉS DE
- BIO-RE
- G-Rex
- MIRAR FIJAMENTE
- REFNE
- REBABA
- iterar
- OSRE
- Minerva
- RxREN
- RxNCM
- BETA
- KDRuleEX
- TREPANAR
- ANN-DT
- DecTexto
- REx
- GEX
- Color rojo oscuro
- SUBCONJUNTO
- Ministerio de Defensa
- Conocimientotron
- NeuroRegla
- RX
- Neurolineal
- completo-RE
- helecho
- CRÉDITO
- ANNT
- GRG
- E-Re-RX
- X-TREPAN
- Ajuste de reglas
- Cosecha de nodos
- DHC
- SGL
- SGL multiclase
- SVM+Prototipos
- hongo
- SQRex-SVM
- ALBA
Filtro de instancia:
- CIF
- RT3
Proceso de aprendizaje :
- validación cruzada k-fold
- Arranque (0,632)
- Navaja
- Tasa de error sin información
- remuestreo
- Muestreo estratificado
- Estimación reforzada
- Intervalos de confianza bayesianos
- Pruebas de permutación
Matriz de confusión:
- Matriz de confusión
- Sesgo de la base de datos
- ROC (datos distribuidos equitativamente)
- AUC (datos distribuidos equitativamente)
- Puntuación F (datos distribuidos equitativamente)
- Puntuaciones de datos "desequilibradas": tasa de error de clasificación, especificidad de recuperación, precisión, exactitud, FPR, FNR, VPN, estadística Kappa, medida H.
- Puntuación de Brier (calibración)
- LogLoss (calibración)
Clasificación no binaria:
- Uno contra todos los OVA
- Uno contra uno OVO
Comparación de algoritmos:
Contenido
PalancaAprendizaje supervisado
El aprendizaje supervisado o aprendizaje automático supervisado aprende patrones y relaciones entre los datos de entrada y salida. Se define por el uso de datos etiquetados. Los datos etiquetados son un conjunto de datos que contienen muchos ejemplos de características y objetivos. El aprendizaje supervisado utiliza algoritmos que aprenden la relación entre las características y el objetivo del conjunto de datos. Este proceso se llama entrenamiento o ajuste.
Hay dos tipos de algoritmos de aprendizaje supervisado:
- Clasificación
- Regresión
Clasificación
La clasificación es un tipo de aprendizaje automático supervisado en el que los algoritmos aprenden de los datos para predecir un resultado o evento en el futuro. Por ejemplo:
Un banco puede tener un conjunto de datos de clientes que contienen historial crediticio, préstamos, detalles de inversiones, etc. y tal vez quiera saber si un cliente incumplirá. En datos históricos tendremos Características y Objetivo.
- Las características serán atributos de un cliente como historial crediticio, préstamos, inversiones, etc.
- El objetivo indicará si un cliente en particular ha incumplido en el pasado (normalmente representado por 1 o 0 / Verdadero o Falso / Sí o No).
Los algoritmos de clasificación se utilizan para predecir resultados discretos. Si el resultado puede tomar dos valores posibles, como Verdadero o Falso, Predeterminado o Sin valor predeterminado, Sí o No, se denomina clasificación binaria. Cuando el resultado contiene más de dos valores posibles, hablamos de clasificación multiclase.
Regresión
La regresión es un tipo de aprendizaje automático supervisado en el que los algoritmos aprenden de los datos para predecir valores continuos como las ventas, el salario, el peso o la temperatura. Por ejemplo:
Un conjunto de datos que contiene características de la casa, como el tamaño del lote, la cantidad de dormitorios, la cantidad de baños, el vecindario, etc. y el precio de la casa. A algoritmo Se puede entrenar la regresión para conocer la relación entre las características y el precio de la casa.