Probabilité d'atteinte d'un état - Complex systems and AI

DIfficulté

Moyen 50%

Contenus

Probabilité d’atteinte d’un état

La probabilité d’atteinte d’un état et par extension le temps d’atteinte d’un état désigne le nombre de temps avant d’atteindre un état de la chaine de Markov.

(X_n)_n désigne une chaîne de Markov homogène d’espace d’états X fini ou dénombrable de matrice de transition Q : on pourra interpréter X_n comme modélisant l’état d’un système à l’instant n.

La loi initiale de la chaîne (X_n) ayant été fixée, seuls interviennent dans l’étude de l’évolution de la chaîne les états susceptibles d’être atteints. On pose X_a = {x ∈ X, il existe n ≥ 0, P(X_n = x) > 0}.

Pour un état e ∈ X_a, on notera T⁽ⁿ⁾_e le temps qu’il faut à la chaine pour atteindre l’état e strictement après l’instant n :

T⁽ⁿ⁾_e désigne donc le plus petit entier k > 0 tel que X_n+k = e si la chaîne passe par e après l’instant n
T⁽ⁿ⁾_e = +∞ si la chaine ne passe pas par l’état e après l’instant n.
Pour simplifier les notations T⁽⁰⁾_e sera aussi noté simplement T_e.

Soit i, e ∈ X_a.

Pour tout n ∈ N et k ∈ N^∗ , la probabilité d’atteindre l’état e à l’instant n+k pour la première fois après l’instant n sachant que X_n = i ne dépend pas de n, on la notera f_i,e(k) = P(T⁽ⁿ⁾_e = k|X_n = i). Elle vérifie l’équation suivante : f_i,e(1) = Q(i, e) et f_i,e(k) = ∑_j∈X\{e} Q(i, j)f_j,e(k − 1) pour tout k ≥ 2.

L’équation pour f_i,e(k) traduit simplement le fait que pour arriver pour la première fois dans l’état e en k pas, en partant de l’état i, il faut aller de l’état i à un état j≠e, puis partant de j, arriver pour la première fois en e en k − 1 pas.

La probabilité d’atteinte d’un état e après l’instant n, sachant que X_n = i ne dépend pas de n, on la notera f_i,e : f_i,e = P(T⁽ⁿ⁾_e < +∞|X_n = i). Elle vérifie : f_i,e = Q(i e) + ∑_j∈X\{e} Q(i,j)f_j,e.

L’équation pour f_i,e traduit le fait que la chaine atteint e à partir d’un état i soit directement, soit passe de l’état i à un état j≠e puis atteint e à partir de l’état j.

Notons que f_i,e=1 si et seulement si f_j,e=1 pour tout état j≠e tel que Q(i,j)>0.

Lorsque la chaîne est ergodique, il est possible de calculer le temps de retour dans un état en calculant l’inverse de la probabilité stationnaire. Pour cela il faut que tous les états sont récurrents positifs, c’est à dire que son espérance est positive et non infini :

Exemple de probabilité d’atteinte d’un état

Afin de montrer comment calculer la probabilité d’atteinte d’un état, nous allons prendre l’exemple suivant.

Supposons que le joueur dispose de 1 euro et joue à un jeu de hasard où la mise est de 1 euro jusqu’à ce qu’il ait atteint la somme de 3 euros ou jusqu’à ce qu’il soit ruiné.

Rappelons que p désigne la probabilité qu’il gagne une partie et donc gagne 1 euro et 1−p est la probabilité qu’il perde la partie et donc perde 1 euro.

On cherche la probabilité qu’il réussisse ainsi à avoir 3 euros, c’est-à-dire f_1,3. L’équation avec i=1 et e=3 s’écrit f_1,3 = pf_2,3 + (1 − p)f_0,3. On a f_0,3 = 0 puisque le joueur ne peut pas jouer s’il n’a pas d’argent initialement (0 est un état absorbant). Il reste à écrire l’équation pour f_2,3 qui est la probabilité qu’un joueur arrive à obtenir 3 euros s’il a au départ 2 euros. On obtient : f_2,3 = 1 − p + (1 − p)f_1,3. On a donc à résoudre un système de 2 équations à 2 inconnues : {f_1,3 = pf_2,3; f_2,3 = p + (1 − p)f_1,3}.

Ce système a une seule solution qui est f_2,3 =p/(1−p(1−p) et f_1,3 =p²/1−p(1−p).

En particulier, si le jeu est équitable c’est-à-dire si p = 1/2, on a f_1,3 = 1/3 ce qui signifie que si le joueur a initialement 1 euro, il a une chance sur trois d’arriver à obtenir 3 euros. La probabilité que le jeu s’arrête car le joueur est ruiné se calcule de façon analogue en écrivant les équations satisfaites par f_1,0, f_2,0 et f_3,0 et en résolvant le système obtenu. Ce calcul permet de voir que f_1,0 + f_1,3 = 1, ce qui signifie que le joueur s’arrête forcément au bout d’un nombre fini de parties soit parce qu’il a réussi à obtenir 3 euros, soit parce qu’il est ruiné.

Temps moyen d’atteinte à partir d’une configuration

En plus de la probabilité d’atteinte d’un état, il est possible de calculer le temps moyen d’atteinte de cet état.

Le temps moyen d’atteinte est la plus petite solution positive du système :

où la classe absorbante désigne les états dans lequel commence le système. En effet, puisque l’on part de ces états, le temps moyen pour les atteindre est de 0 mouvement.

Exemple de temps moyen d’atteinte

Ici la probabilité d’atteinte d’un état n’est pas calculer. Dans les faits, la probabilité d’atteinte d’un état et le temps moyen d’atteinte des états doivent être étudiés ensemble.

Une puce saute sur un triangle, avec une probabilité 2/3 dans le sens horaire, et 1/3 dans le sens anti-horaire.

On numérote les sommets : 1,2,3.
Intéressons-nous aux temps d’atteinte. Nous partons du sommet 1. On a
pour i = 1 : x₁=0
Pour i = 2, 3, nous devons résoudre les systèmes suivants :
- x₂=1+ 1/3 x₁ + 0 x₂+ 2/3 x₃
- x₃=1+ 2/3x₁+ 1/3 x₂+ 0 x₃

Ce qui donne pour solution le vecteur (0, 15/7, 12/7)