Système de reconnaissance immunitaire artificiel

Le système de reconnaissance immunitaire artificielle est inspiré de la théorie de la sélection clonale de l’immunité acquise. La théorie de sélection clonale attribuée à Burnet a été proposée pour tenir compte du comportement et des capacités des anticorps dans le système immunitaire acquis. S’inspirant des principes de la théorie de l’évolution de la sélection naturelle darwinienne, la théorie propose que les antigènes sélectionnent les lymphocytes (à la fois les cellules B et les cellules T). Lorsqu’un lymphocyte est sélectionné et se lie à un déterminant antigénique, la cellule prolifère en faisant plusieurs milliers de copies de plus d’elle-même et se différencie en différents types de cellules (plasma et cellules de mémoire). Les cellules plasmatiques ont une courte durée de vie et produisent de grandes quantités de molécules d’anticorps, tandis que les cellules de mémoire vivent pendant une période prolongée dans l’hôte, anticipant la reconnaissance future du même déterminant. La caractéristique importante de la théorie est que lorsqu’une cellule est sélectionnée et prolifère, elle est soumise à de petites erreurs de copie (modifications du génome appelées hypermutation somatique) qui modifient la forme des récepteurs exprimés. Elle affecte également les capacités de reconnaissance des déterminants ultérieurs à la fois des anticorps liés à la surface des cellules des lymphocytes et des anticorps produits par les plasmocytes.

La théorie suggère qu’à partir d’un répertoire initial de cellules immunitaires générales, le système est capable de se changer (les compositions et les densités des cellules et de leurs récepteurs) en réponse à l’expérience acquis de l’environnement. Grâce à un processus aveugle de sélection et de variation accumulée à grande échelle de plusieurs milliards de cellules, le système immunitaire acquis est capable d’acquérir les informations nécessaires pour protéger l’organisme hôte contre les dangers pathogènes spécifiques de l’environnement. Cela suggère également que le système doit anticiper (deviner) le pathogène auquel il sera exposé et nécessite une exposition à un pathogène qui peut nuire à l’hôte avant qu’il ne puisse acquérir les informations nécessaires pour fournir une défense.

L’objectif de la technique est de préparer un ensemble de vecteurs à valeur réelle pour classer les modèles. Le système de reconnaissance immunitaire artificielle maintient un pool de cellules de mémoire qui sont préparées en exposant le système à une seule itération des données d’entraînement. Les cellules mémoire candidates sont préparées pou le cas où les cellules mémoire sont insuffisamment stimulées pour un modèle d’entrée donné. Un processus de clonage et de mutation des cellules se produit pour la cellule mémoire la plus stimulée. Les clones se font concurrence pour entrer dans le pool de mémoire en fonction de la stimulation et de la quantité de ressources utilisées par chaque cellule. Ce concept de ressources provient de travaux antérieurs sur les réseaux immunitaires artificiels, où une seule cellule (une boule de reconnaissance artificielle ou ARB) représente un ensemble de cellules similaires. Ici, les ressources d’une cellule sont fonction de sa stimulation à un modèle d’entrée donné et du nombre de clones qu’elle peut créer.

L’algorithme suivant fournit un pseudocode pour préparer des vecteurs de cellules de mémoire en utilisant le système de reconnaissance immunitaire artificielle, en particulier l’AIRS2 canonique. Une mesure d’affinité (distance) entre les modèles d’entrée doit être définie. Pour les vecteurs à valeur réelle, il s’agit généralement de la distance euclidienne:

où n est le nombre d’attributs, x est le vecteur d’entrée et c est un vecteur de cellule donné. La variation des cellules pendant le clonage (hypermutation somatique) se produit inversement proportionnelle à la stimulation d’une cellule donnée à un modèle d’entrée.

L’AIRS a été conçu comme un algorithme supervisé pour les domaines problématiques de classification. L’AIRS n’est pas paramétrique, ce qui signifie qu’il ne repose pas sur des hypothèses concernant la structure de la fonction qui est approximative.

Les valeurs réelles dans les vecteurs d’entrée doivent être normalisées de telle sorte que x soit dans [0; 1]. La distance euclidienne est couramment utilisée pour mesurer la distance entre des vecteurs à valeur réelle (un calcul d’affinité), bien que d’autres mesures de distance puissent être utilisées (comme le produit scalaire), et des mesures de distance spécifiques aux données peuvent être requises pour les attributs non scalaires. Les cellules peuvent être initialisées avec de petites valeurs aléatoires ou plus communément avec des valeurs d’instances dans l’ensemble d’apprentissage. L’affinité d’une cellule est typiquement minimisante, alors qu’en tant que cellule la stimulation est maximisante et typiquement dans [0; 1].