Apprentissage Supervisé 101

Apprentissage supervisé ou apprentissage automatique supervisé apprend les modèles et les relations entre les données d’entrée et de sortie. Il est défini par son utilisation de données étiquetées. Une donnée étiquetée est un ensemble de données qui contient de nombreux exemples de fonctionnalités et de cibles. L’apprentissage supervisé utilise des algorithmes qui apprennent la relation entre les fonctionnalités et la cible à partir de l’ensemble de données. Ce processus est appelé formation ou ajustement.

Il existe deux types d’algorithmes d’apprentissage supervisé :

Classification

La classification est un type d’apprentissage automatique supervisé dans lequel les algorithmes apprennent des données pour prédire un résultat ou un événement dans le futur. Par exemple:

Une banque peut disposer d’un ensemble de données client contenant l’historique de crédit, les prêts, les détails des investissements, etc. et elle peut vouloir savoir si un client fera défaut. Dans les données historiques, nous aurons Caractéristiques et Cible.

  • Les caractéristiques seront des attributs d’un client tels que l’historique de crédit, les prêts, les investissements, etc.
  • La cible indiquera si un client particulier a fait défaut dans le passé (normalement représenté par 1 ou 0 / Vrai ou Faux / Oui ou Non.

Les algorithmes de classification sont utilisés pour prédire des résultats discrets. Si le résultat peut prendre deux valeurs possibles telles que Vrai ou Faux, Par défaut ou Aucune valeur par défaut, Oui ou Non, on parle de classification binaire. Lorsque le résultat contient plus de deux valeurs possibles, on parle de classification multiclasse.

apprentissage supervisé

Regression

La régression est un type d’apprentissage automatique supervisé dans lequel les algorithmes apprennent des données pour prédire des valeurs continues telles que les ventes, le salaire, le poids ou la température. Par exemple:

Un ensemble de données contenant des caractéristiques de la maison telles que la taille du terrain, le nombre de chambres, le nombre de salles de bains, le quartier, etc. et le prix de la maison. Un algorithme de régression peut être entraîné pour connaître la relation entre les caractéristiques et le prix de la maison.

apprentissage supervisé