Désordre et fluctuations dans les systèmes physiques : Giorgio Parisi et ses défis pour les mathématiciens

Actualités scientifiques

A l'occasion du prix Nobel de physique attribué en 2021 à Giorgio Parisi, Giambattista Giacomin, professeur à Université de Paris, membre du Laboratoire de Probabilités, Statistique et Modélisation (LPSM), explore certains des résultats et méthodes de G. Parisi et les mathématiques qu'ils ont inspirées.

Le Prix Nobel de physique 2021 a été attribué à Giorgio Parisi for the discovery of the interplay of disorder and fluctuations in physical systems from atomic to planetary scales. Je trouve cette phrase remarquablement riche et frappante. D'une part, elle me rappelle combien ma connaissance des contributions de Parisi est limitée. D'autre part les mots interplay of disorder and fluctuations m'ont marqué car ils correspondent très précisément à une vague récente de recherche en mathématiques. Les résultats obtenus par Parisi (ou plutôt, au sens des mathématiciens, les conjectures qu'il a formulées) ont joué un rôle crucial dans de nombreuses composantes de cette vague, et ont parfois même été la cible principale des recherches. Ce texte sera un voyage au coeur de certains de ces résultats et méthodes, avec une attention particulière aux mathématiques qu'ils ont inspirées.

Il va sans dire que dans ce texte plusieurs des contributions de Parisi à la recherche sont négligées. En particulier je me limite à la  physique statistique, mais Giorgio Parisi a fait des contributions très importantes dans d'autres domaines de la physique - comme la physique des particules et la physique des hautes énergies - ou même dans d'autres domaines scientifiques tout court. À ce propos, et à titre personnel, j'aime bien mentionner qu'il a été l'un des principaux acteurs du projet APE (Array Processor Expansible) qui a amené à la construction hardware et software d'un supercalculateur optimisé pour les simulations.

1. Les verres de spin, les répliques, et la brisure de symétrie des répliques

1.1. Du modèle d'Ising ferromagnétique au modèle de verre de spin d'Edwards-Anderson

Avant d'aborder la notion de Verre de Spin, une introduction accélérée au modèle d'Ising ferromagnétique s'impose. Considérons par exemple l'ensemble $\Lambda_N:=\{-N,-N+1, \ldots, N \}^d$ vu comme un graphe où chaque paire de plus-proches-voisins est reliée par une arête (on utilise la notation $x \sim y$ et on rend $\Lambda_N$ périodique en imposant en plus que $x\sim y$ lorsque $x_j=y_j$ pour tout $j \neq k$ et $x_k=-y_k=N$). Une configuration $\sigma $ de spins dans $\Lambda_N$ est un élément $\sigma$ de $\{-1,+1 \}^{\Lambda_N}$. Pour $J> 0$ (potentiel d'interaction) et $h \in \mathbb R$ (champ magnétique externe), on définit le hamiltonien (i.e., l'énergie) associé à $\sigma $
$$
 H_N(\sigma)\,:=\,\frac J 2 \sum_{\substack{x, y \in \Lambda_N : \\ x \sim y }} \sigma_x \sigma_y + h \sum_{x \in \Lambda_N} \sigma_x\, . \quad (1)
$$

Le modèle d'Ising sur $\Lambda_N$ est la mesure de probabilité $\mu_{N, \beta ,h}$ qui attribue à la configuration de spin $\sigma$ une probabilité proportionnelle à $\exp( \beta H_N(\sigma))$. Il est facile de voir que dans le régime limite $\beta \to \infty$, la distribution de probabilités $\mu_{N, \beta ,h}$ se concentre sur les configurations $\sigma$ maximisant l’énergie $H_N(\sigma)$. On peut aussi voir que, lorsque $h>0$ (respectivement, $h<0$), seule la configuration $\sigma=\sigma^+$ pour laquelle tous les spins sont alignés à $+1$ (respectivement, $\sigma=\sigma^-$ où tous les spins valent $-1$) maximise l'énergie $H_N(\sigma)$. Notons aussi que, lorsque $h=0$, pour toute configuration $\sigma$ différente de $\sigma^+$ et $\sigma ^-$ on a $H_N(\sigma) < H_N(\sigma^+)=H_N(\sigma^-)$ : ainsi deux configurations maximisent $H_N $ si $h=0$.

De manière générale, en mécanique statistique, on s’intéresse au comportement des systèmes contenant un nombre $N$ très grand de particules (ou de spins). Il n’y a dans ce cas là aucune difficulté à considérer le régime limite $\beta=\infty$ lorsque $N\to \infty$ : dans ce cas précis et lorsque $h\neq 0$, la mesure de probabilité $\mu_{N, \infty ,h}$ est concentrée sur une seule configuration et ce résultat persiste en passant à la limite $N=\infty$. Autrement dit, tous les spins s'alignent à $+1$ (resp. $-1$) pour $h>0$ (resp. pour $h<0$) lorsque $\beta=\infty$.

La question est bien plus ardue lorsque $\beta < \infty$, puisque $\mu_{N,\beta ,h}(\sigma)>0$ pour chaque configuration $\sigma$. On préfère donc se concentrer sur la moyenne $m_{\beta,h} $ du spin sur le site $x$, i.e. $m_{\beta,h}= \lim_N \sum_\sigma \sigma_x \mu_{N,\beta ,h}(\sigma)$. L'invariance par translation induite par les conditions de bord implique que $m_{\beta,h}$ ne dépend pas du site $x$. Au vu des remarques précédentes, il n'est pas surprenant de constater que $m_{\beta, h}=-m_{\beta, -h}>0$ lorsque $h>0$. Il est cependant remarquable qu'en dimension $d\ge 2$

  • Pour $\beta$ suffisament grand $m_\beta^*:=\lim_{h \searrow 0} m_{\beta, h} = - \lim_{h \nearrow 0} m_{\beta, h} >0$, ce qui implique que $h \mapsto m_{\beta, h}$ n'est pas continue en $h=0$;
  • Pour $\beta$ suffisament petit, $m_\beta^*=0$ et $h \mapsto m_{\beta, h}$ est continue partout.

Ce phénomène est la signature d'une transition de phase, où une aimantation spontanée $\pm m^*_\beta$ persiste lorsque $h$ tend vers $0$. On note que pour $h=0$, le modèle admet une symétrie inversant le sens des spins $\sigma \to -\sigma$: en passant à la limite $N\to \infty $, cette symétrie se brise puisque $m^*_\beta>0$.

L'introduction d'un champ extérieur s'avère de fait très utile car elle brise la symétrie du système et permet d'étudier le système en fonction du paramètre d'ordre de cette transition, qui correspond ici à l'aimantation $m_{\beta, h}$. On notera que dans ce cas, le paramètre d'ordre est discontinu à la transition, et la transition de phase est dite du premier ordre (on reviendra sur ce point dans la section 3).
 
On peut facilement voir que $m_{\beta, 0}=0$ pour toute valeur $\beta \in [0, \infty]$. Ainsi $m_{\beta, 0}$ apporte trop peu d'information sur le système. En effet, en considérant le cas $\beta= \infty$, on voit que pour $\mu_{N, \infty , 0}$ tous les spins sont alignés : avec probabilité $1/2$ tous les spins valent $+1$ et avec probabilité $1/2$ tous les spins valent $-1$. Ce résultat évidemment persiste pour $N=\infty$. En utilisant la théorie mathématique des perturbations autour de deux états $\sigma ^+$ et $\sigma ^-$ on peut montrer que cette situation persiste pour $\beta$ suffisamment grand et $N=\infty$, dans le sens que avec probabilité $1/2$ les configurations de spin observées ne seront que des perturbations de $\sigma ^+$ (ou de $\sigma ^-$). D'autre part, on peut montrer que pour $\beta$ petit le système est très proche du cas $\beta=0$. Donc nous avons une situation dans laquelle l'aimantation n'est pas un paramètre d'ordre adéquat pour décrire le système si on fait varier $\beta$.

On ne peut nier que le modèle d'Ising reste un modèle très simplifié du comportement d'un aimant. On peut faire un premier pas vers une modélisation plus réaliste en admettant que le potentiel d'interaction dépende aussi de l'espace : ceci permet de prendre en compte des impuretés dans le modèle, comme par exemple des irrégularités du réseau. Dans cette démarche, considérons le hamiltonien d'Edwards-Anderson (EA) (avec $h=0$ pour simplifier)
$$
H^{\textrm{EA}}_{N,J}(\sigma)\,:=\,\frac 1 2 \sum_{ \substack{x, y \in \Lambda_N : \\ x \sim y }} J_{x ,y}\sigma_x \sigma_y \, ,   \quad (2)
$$

avec un potentiel d'interaction symétrique $J_{x,y}=J_{y,x}$. Le modèle est défini une fois qu'on s'est donné une famille $(J_e)$ de potentiels indexée par les arêtes du graphe. Cela pose naturellement la question du choix des $(J_e)$. Ce point est crucial dans notre présentation car il fait apparaître la notion de système désordonné.
 
Un choix naturel des $(J_e)$ pour modéliser des impuretés consiste à choisir les $(J_e)$ aléatoirement: on peut par exemple choisir les $(J_e)$ comme une famille de variables indépendantes et identiquement distribuées. Pour fixer les idées avec un cas simple, on peut tirer les $J_e$ prenant les valeurs $\pm J $ de manière équiprobable. Le modèle devient alors désordonné. On retient en particulier que :

  • le modèle n'est plus invariant par translation (ou plutôt rotation : les conditions au bord sont périodiques), mais le reste dans un sens statistique ;
  • il y a deux aléas dans le système, mais leur nature est très différente : le désordre $(J_e)$ est gelé une fois pour toute au début de l'expérience (on utilise alors la terminologie quenched ou trempé en français : cette terminologie provient de la métallurgie), tandis que les spins $\sigma$ fluctuent;
  • Il est aussi naturel de regarder dans un premier temps le cas d'un désordre faible, lorsque $J_e=+J$ avec probabilité $1-\varepsilon$ pour $\varepsilon>0$ très petit (et $J_e=-J$ avec probabilité $\varepsilon$). Ce problème qui pourrait paraître simple à cause de sa proximité du cas de $\varepsilon=0$ donne en pratique lieu à des questions difficiles et importantes. Mais nous avons proposé de considérer le cas où $\varepsilon=1/2$ et le désordre n'est pas faible. C'est ce dernier cas qui permet d'aborder la question des verres de spins.

Un coup d'œil à la figure 1 suffit pour se convaincre qu'il y a beaucoup d'états fondamentaux (i.e., configurations de spin qui maximisent l'énergie) dans le modèle EA. Le mot clé pour expliquer cela est la frustration. Le concept même de frustration ouvre la porte à un monde de phénomènes réels nécessitant de vastes explications qui dépassent largement le contenu de cette note, mais illustre l'étendue du spectre des recherches et méthodes développées par Parisi [27, 32]. On passe ainsi d'un modèle avec deux états fondamentaux (comme pour Ising ferromagnétique) à un modèle qui en admet beaucoup. {Ces états fondamentaux n'ont pas d'aimantation globale (i.e., la moyenne des spins sur une grande région est proche de $0$). Dans leurs prédictions, Edwards et Anderson s'attendent à un comportement très différent pour les grandes et petites valeurs de $\beta$ aussi pour leur modèle. Cela demande de trouver un paramètre d'ordre adéquat pour cette transition. L'aimantation ne semble pas ici fournir de description suffisante. Edwards et Anderson suggèrent que pour $\beta$ grand le modèle EA a ce qu’on appelle un comportement de verre de spin et notamment que dans la limite $N\to \infty$

  • le système présente un certain ordre local, mais il n'y a pas d'ordre à longue distance : nous entendons par cela qu'à basse température (i.e., $\beta$ suffisamment grand) l'aimantation moyenne du spin $\langle \sigma _x \rangle_J$ est non nulle et dépendante du site (rappelons que $J$ est un échantillon fixé des variables de désordre). Mais en moyennant sur des grandes régions, cette aimantation disparaît.
  • le comportement du verre de spin peut être lu à partir de $q:=\mathbb E [(\langle \sigma _x \rangle_J)^2]$ où $\mathbb E$ est l'espérance sur le désordre $J$: $q$ est le paramètre d'ordre proposé dans [12], avec la conjecture qu'on a $q>0$ pour $\beta$ grand, tandis que $q$ devient $0$ en dessous d'un seuil et que le système se comporte comme pour Ising ferromagnétique avec $\beta$ petit.
frustration
Figure 1. La frustration se produit lorsque les interactions de paires ne peuvent pas être satisfaites simultanément, et conduit à l'existence de nombreuses configurations de spins d'énergie maximale. Nous représentons ici quatre cas différents : les liens ferromagnétiques ont une énergie $J>0$ s'ils connectent deux spins alignés (les deux $+1$ ou les deux $-1$) et énergie $-J$ s'ils connectent deux spins opposés. Les liens antiferromagnétiques ont une énergie $J$ (resp., $-J$) s'ils relient des spins opposés (resp., alignés). En partant du coin supérieur gauche, on voit qu'une plaquette contenant quatre sites avec des interactions ferromagnétiques n'a que deux configurations à énergie maximale possibles ($4J$): on ne montre ici que la configuration où tous les spins sont alignés à $+1$, la configuration opposée donne la même énergie. En dessous, on présente le cas de liens mixtes ferromagnétiques et antiferromagnétiques qui ne conduisent pas à de la frustration: à nouveau, toutes les interactions peuvent être satisfaites simultanément et il n'y a que deux configurations d'énergie maximale ($4J$). Dans le dernier exemple (en bas à gauche) avec une plaquette carrée, on voit par contre que tous les liens ne peuvent être satisfaits simultanément et $8$ des $16$ configurations possibles sont d'énergie maximale ($2J$) : ces plaquettes sont annotées FR pour indiquer la frustration. Enfin, à droite on présente une plaquette triangulaire où toutes les interactions sont antiferromagnétiques: ce cas est frustré même en absence d'interactions mixtes et $6$ des 8 configurations sont énergie maximale ($J$).

Cette liste ne donne qu'un début de la description de la phase de verre de spin, puisque, par exemple, une vision dynamique du problème devrait être prise en considération. De plus, une présentation appropriée devrait détailler les observations physiques qui ont motivé le développement de la théorie : il s'agissait en fait de modéliser un comportement atypique de certains matériaux magnétiques et, en particulier, l'observation d'une singularité bien précise dans le comportement de la susceptibilité en fonction de la température à une valeur spécifique de la température. Je vais laisser complètement de côté la question de savoir si le modèle EA modélise bien ou non la phénoménologie observée dans les verres de spin, et à partir de quelle dimension (les modèles de verre de spin à courte portée sont des modèles peu compris : voir par exemple [30, 32]). Le reste de cet exposé est consacré à la version en champ moyen du modèle EA, qui elle est bien mieux comprise. C'est dans ce contexte qu'on va esquisser certaines des idées de Parisi qui ont finalement été (et sont encore) appliquées à tous les systèmes désordonnés.

1.2. Verres de spin en champ moyen : le modèle de Sherrington et Kirkpatrick

Dans le feu de l'activité scientifique autour de la modélisation des phénomènes de verre de spin, David Sherrington et Scott Kirkpatrick ont écrit un article Solvable model of a spin glass [40] au titre très intéressant, puisque leur solution exacte n'est valable que pour $\beta$ en dessous d'un certain seuil. Mais le titre en lui même s'est avéré prophétique. Leur modèle est la version en champs moyen - i.e., avec un graphe d'interaction complet - du modèle EA (2), où les interactions $(J_e)$ sont des gaussiennes standard (i.e., moyenne zéro et variance unitaire) et indépendantes. Le hamiltonien de ce système s'écrit
$$
H^{\text{SK}}_{N, J}(\sigma)\,:=\,\frac 1 {2 \sqrt{N }} \sum_{\substack{x, y \in \{1, \ldots, N\} : \\ x \neq y }} J_{x,y}\sigma_x \sigma_y \, ,  \quad (3)
$$

où le facteur $1/2$ est introduit pour des raisons de symétries (puisque $J_{x,y}=J_{y,x}$). On remarque qu'à la différence du régime en champs moyen où l'on normalise le hamiltonien d'un système à $N$ spins (chacun ayant $N-1$ voisins), le hamiltonien (3) est normalisé par $\sqrt{N}$ pour obtenir un modèle non-trivial. Ceci provient du fait que $\sum_{y:\, y\neq x} J_{x,y} \sigma_y / \sqrt{N-1}$ reste une gaussienne standard pour chaque spin $\sigma$ et site $x$.

On cherche à étudier le comportement de la densité d'énergie libre
$$
 F(\beta, h)\, :=\, \lim_{N\to \infty} \frac 1N\mathbb E \big[\log Z_{N, \beta, h J} \big] \, ,  \quad (4)
 $$

$$
 Z_{N, \beta,h, J}\, :=\, \sum_{\sigma \in \{-1, +1\}^N} \exp \left( \beta H^{\text{SK}}_{N, J}(\sigma) + h \sum_{n=1}^N \sigma_n\right)\, ,
 $$

et nous avons introduit le champ extérieur $h \in \mathbb R$ d'une manière physiquement non conventionnelle : $h$ devrait apparaître comme $\beta h$ (mais nous travaillons aussi avec une convention de signes qui n'est pas conforme au choix des physiciens, mais elle est conforme à l'envie de concision des mathématiciens). D'un point de vue probabiliste, l'importance de l'énergie libre est aisément comprise car elle est une fonction génératrice. On notera que l'utilisation de l'espérance $\mathbb E$ dans la définition est superflue car $\log Z_{N, \beta, J}$ concentre autour de sa moyenne (e.g. [42, p.16]) pour $\mathbb P$-presque tous les échantillons de $J$.

Les $(H^{\text{SK}}_{N, J}(\sigma))_{\sigma \in \{\-1,+1\}^N} $ formant une famille de $2^N$ gaussiennes centrées, elle sont donc uniquement caractérisées par leur matrice de covariance. Les propriétés élémentaires du calcul gaussien permettent de calculer aisément les moments de $Z_{N, \beta, J}$. Le comportement asymptotique de Laplace du moment d'ordre $n$ est (e.g. [42, Sec. 1.13])
$$
\lim_{N \to \infty} \frac 1N {\log \mathbb E \left[\left(Z_{N, \beta,h, J}\right)^n\right]} \,=\, n \log 2 + \frac 14 \max _q
 \left( n \beta^2 (1-q)^2 - n^2 \beta^2 q^2+ 4 \log \mathbb E \cosh^n\left(\mathcal N_{q} \right)
 \right),   \quad (5)
$$

avec $\mathcal N_q$ une variable gaussienne de moyenne $h$ et de variance $\beta^2 q$. Le lecteur intéressé trouvera au début de section 1.3 une piste pour démontrer ce résultat : cette piste permet d'introduire le concept crucial de réplique(s). Le réel $q= q_n$ maximisant la valeur de (5) admet une expression semi-explicite que l'on peut trouver dans [42, (1.408)]. {Lorsque l'on s'intéresse à la limite de $\lim_N (1/N)\mathbb E \log Z_N$, où $Z_N=Z_{N, \beta,h, J}$, la démarche naturelle consiste à utiliser l'identité $\lim_{t\searrow 0} (1/t) \log \mathbb E [Z_N^t]= \mathbb E \log Z_N$. Appliquer cette identité pose quand même plusieurs soucis: tout d'abord l'expression des moments de (5) n'est valable pour les valeurs entières de $n$, pour ne pas mentionner l'inversion de l'ordre du passage à la limite $N \nearrow \infty$ et $n\searrow 0$. Néanmoins, Sherrington et Kirkpatrick décident de négliger les problèmes mentionnés ci-dessus pour mener le calcul et ils trouvent une formule pour $F(\beta, h)$. Comme le remarquent eux même les auteurs, cette solution conduit à une contradiction majeure (i.e., un système avec une entropie négative) lorsque $\beta$ est suffisamment grand, ce qui indique que leur raisonnement est inexact dans cette plage de températures.

1.3. La solution de Parisi

L'interprétation faite par les physiciens du calcul de moments (5) est la clef pour comprendre l'idée de la solution de Parisi. Elle se base sur l'identité élémentaire :
$$
\mathbb E \left[\left(Z_{N, \beta,h, J}\right)^n\right]\, =\, \sum_{\sigma^1} \sum_{\sigma^2} \ldots \sum_{\sigma^n}
 \exp\left( \frac {\beta ^2}{2 N} \sum_{i< j} \sum_{\alpha=1}^n \sum_{\beta=1}^n \sigma_i^\alpha \sigma_i^\beta \sigma_j^\alpha \sigma_j^\beta\right) \, ,  \quad (6)
$$  

(chaque $\sigma^\alpha$ dans la somme précédente prend ses valeurs dans $\{-1, +1 \}^N$). On peut démontrer cette identité en remarquant d'abord que $(Z_{N, \beta,h, J})^n$ peut s'écrire comme le produit de $n$ termes où la somme sur la variable muette $\sigma$ est remplacée par des sommes sur $n$ variables $\sigma^\alpha$, $\alpha=1, \ldots, n$. Puis des propriétés élémentaires des variables gaussiennes permettent de passer au calcul de l'espérance $\mathbb E$ : il suffit d'utiliser que pour $\mathcal N$ gaussienne standard on a que $\mathbb E \exp( a \mathcal N) = \exp(a^2/2)$, et on obtient (6). Le même calcul sur les variables gaussiennes permet de récrire le terme exponentiel du membre de droite de (6) comme la moyenne sur un ensemble de $n(n-1)$ gaussiennes standard indépendantes $(Z_{\alpha, \beta})_{1 \le \alpha < \beta \le N}$ (voir e.g. [40, 42] pour plus de précisions). Je m'abstiens de reproduire ce calcul et me réfère à [40, 42], mais le fait est que avec la réplication ($n$ fois) du système d'origine pour calculer le $n$-ième moment de la fonction de partition, on obtient une formule pour le membre de gauche de (5) dans laquelle le maximum devrait être pris sur un paramètre qui est une matrice symétrique $(q_{\alpha, \beta})_{1 \le \alpha , \beta \le n}$. Au final, on peut montrer que le maximiseur est atteint pour des matrices dont les termes hors diagonale sont constants. Cela reflète le fait que les répliques sont échangeables (symétriques) pour le calcul des moments : l'ansatz de Sherrington-Kirkpatrick est la propagation de cette symétrie au cas $n<1$.

Pour aller au delà du problème présenté par la solutions de Sherrington et Kirkpatrick il est naturel de s'autoriser de briser la symétrie des répliques (c'est-à-dire qu'on ne suppose plus que les termes non diagonaux de $q$ sont constants). En réalité, il faut d'abord décider ce qu'est une matrice $n\times n$ pour $n\in (0,1)\ldots$! Comme le lecteur s'en rend certainement compte, à partir de là, les choses deviennent un terrain plutôt dangereux pour les mathématiciens (mais pour les physiciens aussi): en fait, la mise en œuvre de la brisure de symétrie des répliques n'est en aucun cas simple (voir notamment la fin de la section 2.4). Néanmoins, Giorgio Parisi a produit à la fin des années 70 une formule précise pour $F(\beta, h)$ [34, 38] : la formule n'est pas extrêmement complexe, mais elle est hautement non triviale et novatrice. En particulier, le paramètre d'ordre n'est plus de dimension finie. Le lecteur intéressé pourra par exemple consulter l'introduction de [17], ou [4] où le lien avec des modèles plus simples [10, 31] est discuté. La formule de Parisi a été un mystère pour les mathématiciens, avant de devenir un défi. En réalité, pendant très longtemps l'existence même de la limite définissant $F(\beta, h)$ était une question ouverte : ce problème a été résolu en 2002 par Francesco Guerra et Fabio Toninelli dans [18] par une astuce d'interpolation très originale. Et puis les choses sont allées vite : Guerra [17] a d'abord donné une preuve que $F(\beta, h)$ n'est pas plus grand que la formule de Parisi. Puis Talagrand a montré que la formule de Parisi est bien correcte en montrant qu'elle n'est pas plus petite [41]. Les choses sont allées vite en partie parce que l'astuce d'interpolation s'est avérée être un ingrédient important, mais on pourrait aussi lire ces événements comme un avertissement qu'il ne faut pas sous-estimer les preuves d'existence (même si les étapes restantes sont hautement non triviales).

A présent, la solution de Parisi a été retrouvée avec d'autres approches en physique, voir par exemple [28]. De plus, ce qui se passe réellement dans la phase de verre de spin au-delà de ce que nous dit la densité d'énergie libre est mieux compris au niveau de la physique [27, 29] et aussi au niveau mathématique, voir en particulier [5, 33], même si la plupart des défis sont encore ouverts [42, 43]. Les calculs de répliques (avec ou sans brisure de symétrie) sont devenus une méthode standard en mécanique statistique, mais aussi en dehors des questions strictement physiques. Je ne peux vraiment pas faire plus que donner quelques mots-clés sur ces autres directions : repliement des protéines, réseaux de neurones, complexité computationnelle, problèmes d'optimisation combinatoire, modélisation des réseaux sociaux [11, 27, 32].

2. Le modèle de croissance d'interfaces de Kardar-Parisi-Zhang (KPZ)

2.1. Le modèle KPZ (premier coup d'oeil)

Maintenant nous abordons une question qui a priori ne concerne pas les modèles désordonnés (mais on verra à la section 2.4 qu'elle est naturellement liée à des questions sur des systèmes désordonnés). En 1986, Giorgio Parisi a publié l'article « Dynamic Scaling of Growing Interfaces » avec Mehran Kardar et Yi-Cheng Zhang [23]. Les auteurs y proposent un modèle (une Equation Différentielle Stochastique nonlinéaire aux Dérivées Partielles (EDPS)) pour comprendre les fluctuations dans des modèles de croissance : cette EDPS est
$$
 \frac{\partial h}{\partial t} \, =\, \nu \nabla^2 h + \frac{\lambda} 2 \left( \nabla h\right)^2 + \sqrt{D}\, \eta\, ,   \quad (7)
$$

où $h$ est une fonction de l'espace $\mathbb R^d$ et du temps, $\nu, \lambda$ et $D$ sont des constantes strictement positives et $\eta$ est un bruit blanc spatio-temporel. Donc $\eta$ est un processus stochastique avec des trajectoires qui ne sont pas des fonctions, mais des distributions. En fait, à niveau de $\eta$ il n'y a pas de différence entre espace et temps : l'espérance (i.e., la moyenne) du carré de l'intégrale de $\eta$ fois une fonction test $\phi:\mathbb R^{d+1}\to \mathbb R$ vaut $\int \phi^2(x,t) \mathrm{d} x \mathrm{d} t$. J'ai choisi de m'en tenir le plus possible aux notations de [23] : $ \nabla^2$ est le Laplacien et $\left( \nabla h\right)^2$ est le produit scalaire de $\nabla h$ avec soi-même.

Avant d'expliquer les raisons de l'impact que [23] a eu sur la communauté scientifique, remarquons que l'équation (7) n'est mathématiquement pas bien posée : en écrivant la solution explicite du cas linéaire $\lambda=0$ (c'est juste l'équation de la chaleur avec un terme de forçage, donc l'équation est facilement exprimée en termes du noyau de la chaleur), on voit facilement que la solution n'est pas dérivable dans l'espace (en fait, la solution n'est une fonction que si $d=1$). Le gradient $\nabla$ de la solution est donc seulement une distribution et il manque une porte d'entrée naturelle au cas $\lambda>0$.
 
Mais [23] ne se limite certainement pas à (7) : c'est un article de physique qui vise à comprendre une classe de phénomènes physiques et, notamment, les phénomènes de fluctuations atypiques observés dans la croissance d'interfaces. Notamment, (7) est donnée avec des prédictions précises sur le comportement attendu à grande échelle (en espace et en temps) des solutions : en principe, cette information peut être utilisée comme un guide vers la bonne interprétation de (7). Ceci est a priori une tâche ardue, parce que le comportement à grande échelle des solutions d'équations non linéaires est souvent un problème difficile, voire hors de portée. Mais (7) fournit d'autres indices précieux : les auteurs remarquent en particulier que via la transformation de Cole-Hopf $Z:=\exp(-(\lambda/(2\nu)) h)$ on a
$$
 \frac{\partial Z}{\partial t} \, =\, \nabla^2 Z - \frac{\lambda \sqrt{D}} {2\nu} Z \eta\,    \quad (8)
$$  

et ceci est central dans [23] pour lier le modèle KPZ (7) au modèle d'un polymère dirigé dans un environnement aléatoire présenté dans la section 2.4. Mais prenons cet indice d'un point de vue mathématique : notre première impression peut être que, puisque nous n'avons pas donné de sens précis à (7), passer à (8) est au moins aussi imprécis. Mais (8) est juste une équation linéaire et nous pouvons essayer de donner un sens à (8) et ensuite l'utiliser pour donner un sens à (7). Le problème est que le bruit entre dans (8) de manière multiplicative et $Z$ fois $\eta$ demeure, a priori, mal défini, même si ce point semble moins difficile que le problème de donner un sens à $(\nabla h)^2$. En fait, a priori on peut penser que le problème est plus grave si la dimension augmente : ça n'est pas forcément le cas. En particulier, pour $d=3$ ou plus, à grande échelle, le terme non linéaire est prédit comme non pertinent par Kardar, Parisi et Zhang (i.e., le cas $\lambda>0$ devrait se comporter comme le cas trivial $\lambda=0$). Le modèle KPZ en $d\ge 2$ a attiré et attire l'attention des mathématiciens, mais nous choisissons de nous limiter à $d=1$ pour la suite.
 
Venons-en donc à (8) pour $d=1$ : il s'avère que ce problème relève de la théorie standard des EDPS. Mais dans ce domaine, et même dans le domaine des SODE (où O signifie Ordinaire), il faut spécifier quelle intégrale stochastique - ou, de manière équivalente, quel calcul stochastique - on utilise. Il s'agit de la question à la base de l'analyse stochastique : définir $\int_0 ^t Z(s) B'(s) \mathrm{d} s$, avec $Z(\cdot)$ une fonction aléatoire et $B(\cdot)$ un mouvement brownien standard (donc $B'$ est un bruit blanc). L'approche naturelle de remplacer l'intégrale par une une suite de sommes finies va dépendre de la manière dont la discrétisation est effectuée. Et en fait il existe différentes notions d'intégrale stochastique (It$\bar{\mathrm o}$, Stratonovich,$\ldots$). Ainsi, également dans le contexte d'une EDP stochastique, il faut faire un choix : a priori on pourrait être tenté par l'approche de Stratonovich, car elle est souvent considérée comme le choix des physiciens et parce que elle est cohérente avec les passages qui lient (8) à (7) : le calcul différentiel de Stratonovich est le calcul ordinaire et nous avons utilisé le calcul ordinaire pour passer de (7) à (8). Mais il s'avère que (8) est mal définie au sens de Stratonovich. Elle est cependant bien définie au sens d'It$\bar{\mathrm o}$ et, plus que cela, la solution de (8) interprétée au sens It$\bar{\mathrm o}$ est bien définie pour des données initiales continues $x \mapsto Z(x,0)$ (avec une condition sur la croissance de $Z(x,0)$ pour $\vert x \vert$ grand); de plus, $(x,t) \mapsto Z(x,t)$ est continue et elle vérifie la propriété importante que si $Z(x,0)>0$ pour tout $x$, alors $Z(x,t)>0$ pour tout $t>0$ et tout $x$ (voir [3] et les références qu'il contient).

Maintenant, nous inversons la transformation de Cole-Hopf en posant $h:= -(2\nu / \lambda) \log Z$: mais le calcul différentiel d'It$\bar{\mathrm o}$ n'est pas le calcul ordinaire et le mieux qu'il puisse arriver est que la fonction $h$ que nous avons définie ne résolve pas vraiment (7). En réalité les choses sont encore pires, car en essayant d'appliquer le calcul d'It$\bar{\mathrm o}$, la variance de $\eta(x,t)$ (égale à $\infty$) apparaît.
 
Ce nouveau problème vient du manque de régularité dans l'espace du bruit blanc. Pour contourner cela, on peut régulariser $\eta$ dans l'espace par convolution avec $x \mapsto J_\kappa(x):=\kappa J(\kappa x)$, avec $J(\cdot)$ une densité de probabilité lisse, paire et à support compact. Si nous appelons $\eta_\kappa$ ce nouveau bruit et si nous remplaçons $\eta$ par $\eta_\kappa$ dans (8), nous avons que (8) est toujours bien définie au sens d'It$\bar{\mathrm o}$ et la formule d'It$\bar{\mathrm o}$ peut être appliquée pour revenir à une équation pour $h$ qui contient cependant un terme supplémentaire :
$$
 \frac{\partial h}{\partial t} \, =\, \nu \nabla^2 h + \frac{\lambda} 2 \left(\left( \nabla h\right)^2 -C_\kappa\right) + \sqrt{D}\, \eta_\kappa\, ,   \quad (9)
 $$
où $C_\kappa=(D/ \nu)\int_\mathbb R (J_\kappa(x))^2 \mathrm{d} x$ et $\lim_ {\kappa \to \infty} C_\kappa=\infty$. Donc $h=-(2\nu / \lambda) \log Z$, avec $Z$ solution de (8) au sens de It$\bar{\mathrm o}$, est plutôt solution de
$$
 \frac{\partial h}{\partial t} \, =\, \nu \nabla^2 h + \frac{\lambda} 2 \left(\left( \nabla h\right)^2 -\infty\right) + \sqrt{D}\, \eta\, ,  \quad (10)
$$

Ainsi, à ce stade, la solution proposée à l'équation KPZ (7) peut apparaître plutôt arbitraire : mais pas si arbitraire si l'on considère les procédures de renormalisation effectuées sur les non-linéarités en théorie des champs.

C'est le moment de retourner à [23] et à tout ce que l'on y trouve sur les solutions à (7).

2.2. La classe d'universalité KPZ : le comportement à grande échelle des interfaces croissantes

Comme nous l'avons déjà mentionné, [23] est un article de physique qui propose le modèle (7) dans le contexte des phénomènes de croissance. De plus, dans [23] on trouve des prédictions précises sur le comportement des solutions.

kpz
Figure 2. Une représentation graphique concise de trois modèles unidimensionnels (souvent appelés $1+1$ dimensionnels) d'interfaces croissantes. Le Modèle 1 est un modèle sur un réseau tel que sur chaque site il y a une horloge de Poisson avec un taux unité (c'est-à-dire que l'horloge sonne à des temps aléatoires : les différences entre ces temps sont des variables aléatoires exponentielles indépendantes de moyenne $1$ ; les horloges sur différents sites sont également indépendantes). Lorsque l'horloge d'un site sonne, un bloc tombe sur la colonne de blocs de ce site : sur (a) et (b) on voit ce qui se passe si l'horloge du troisième site sonne en premier, puis l'horloge du quatrième site sonne. Les images (a) et (c) montrent ce qui se passe dans le modèle de dépôt balistique (Modèle 2) lorsque les horloges sonnent comme pour le premier exemple : dans le modèle 2, les blocs collent aux colonnes voisines. En d'autres termes, si $h(j)$ est la hauteur de la colonne à $j$, le mécanisme de mise à jour lorsqu'un bloc tombe sur $j$ est que $h(j)$ est remplacé par $\max(h( j-1), h(j)+1, h(j+1))$. Le Modèle 3 (images (d), (e) et (f)) a une nature différente : la hauteur de l'interface est la trajectoire d'une marche aléatoire simple (c'est-à-dire une marche qui ne peut que monter ou descendre de un pas dans une unité de temps). Les seuls endroits où les dépôts sont autorisés sont le minima locaux : une horloge de Poisson de taux $p$ est associée aux minima locaux et, lorsqu'elle sonne, le minimum devient un maximum ((d) à (e)). Aussi l’évaporation de blocs est autorisée, mais seulement aux maxima locaux : pour passer d'un maximum à un minimum ((e) à (f)) le taux est $q$ et l'interface est croissante si $p>q$.

La classe des modèles KPZ n'est pas définie avec précision a priori : comme il ressort de ce qui suit, décider si un modèle appartient ou non à cette classe est généralement difficile. Commençons donc par souligner que toutes les interfaces croissantes ne font pas partie de cette classe. Pensons au cas le plus trivial de petits blocs tombant au hasard sur une ligne discrétisée (voir Fig. 2 et sa légende) : dans ce cas les hauteurs des colonnes de blocs au temps $t$ ne sont que des variables aléatoires de Poisson indépendantes de moyenne $t$. Donc en première approximation l'interface est une ligne horizontale qui, au temps $t$, est à la hauteur $t$. Cependant, la hauteur de la colonne sera généralement à une distance d'environ $\sqrt{t}$ de cette ligne et la ligne qui décrit le haut de ces colonnes aura beaucoup de fluctuations en raison du mécanisme de croissance indépendant : en effet, par le Théorème Centrale Limite, la hauteur de l'interface sur chaque site est proche d'une variable gaussienne d'espérance $t$ et écart type $\sqrt{t}$, et les variables sur des sites différents sont indépendantes. Ce premier exemple correspond à $\nu=\lambda=0$.

Pour essayer d'aller un peu plus loin dans la caractérisation de la classe KPZ nous attirons l'attention du lecteur sur les deux autres modèles de la figure 2. Dans ces modèles, il existe à nouveau un mécanisme de croissance indépendant (en espace et en temps), mais une dépendance en la pente du profil apparaît, ainsi qu'un mécanisme de lissage. L'équation KPZ (7) est censée capturer ces trois aspects (croissance avec indépendance[9], dépendance en la pente, mécanisme de lissage) : ils sont en fait associés aux termes qui dépendent respectivement des paramètres $D$, $\lambda$ et $\nu$. Sur ce point, nous renvoyons le lecteur à [23, 24] : ici nous soulignons simplement que (7) est censé capturer les fluctuations et non la vitesse de croissance elle-même. De plus, a priori il n'est pas évident que les modèles 2 et 3 de la figure 2 correspondent à (7) avec $\lambda>0$ (en effet, le fait que le modèle 2 appartient à la classe KPZ est une conclusion basée uniquement sur des observations numériques).
 
La prédiction que l'on trouve dans [23] est que les fluctuations de la hauteur de l'interface au temps $t$ on une loi d'échelle en $t^{1/3}$ et que, contrairement au modèle 1, les corrélations entre les hauteurs aux différents sites ne sont pas nulles. En fait, les corrélations ont également un comportement d'échelle et l'échelle est $t^{2/3}$. Donc on voit que, pour un temps donné $t$, la fonction aléatoire $(h(x,t))_{x\in \mathbb R}$ a le même comportement que le mouvement brownien sous changement d'échelle : c'est un point crucial discuté en profondeur dans [23, 24].
 
Avant de passer à certains des progrès importants réalisés par les mathématiciens, nous soulignons que beaucoup des résultats que l'on trouve dans [23] sont tirés d'autres articles et sont dus à plusieurs chercheurs : la contribution fondamentale de [23] a été de rassembler des résultats sur divers modèles, certains d'entre eux éloignés des modèles de croissance d'interface (voir Section 2.4), et de proposer une large classe de modèles avec un type commun de fluctuations non gaussiennes (une classe d'universalité).

Une première percée de grande importance pour les mathématiciens (mais aussi pour la physique) a été réalisée dans [2, 22] : la classe KPZ n'est pas vide ! En effet dans [2, 22] on trouve une caractérisation précise de la loi de la variable aléatoire qui décrit les fluctuations de la hauteur sur un site pour un modèle de croissance d'interface (le modèle 3 de Fig. 2, avec $h(0,x)= \vert x\vert$ et $p=1-q=1$). De cette façon, le comportement en $t^{1/3}$ a été confirmé. Ce n'est pas tout : la limite $t\to \infty$ de la hauteur rénormalisée s'est avérée déjà connue : c'est la loi de Tracy-Widom obtenue par changement d'échelle de la plus grande valeur propre de certaines grandes matrices aléatoires (GUE : Gaussian Unitary Ensemble) [44]. Il est clairement superflu de souligner l'importance de ce pont qui est apparu avec le domaine de recherche des grandes matrices aléatoires !

Une seconde percée a été réalisée dix ans plus tard et au même moment par [1] et [39] : le modèle KPZ (7), tel que défini dans [3] et pour des conditions initiales particulières, est dans la classe KPZ. Pour (plusieurs) généralisations de ce résultat, et bien plus, nous suggérons l'article de synthèse [9].

2.3. Retour au modèle KPZ.

En 2010 il devient donc clair que l'interprétation de la solution de l'équation KPZ (7) via la solution It$\bar{\mathrm o}$ de (8) est la bonne interprétation. Néanmoins, une telle solution dépend entièrement de la transformation de Cole-Hopf. Cependant en 2013 Martin Hairer a introduit une nouvelle approche à l'équation KPZ [9], qui évite la transformation de Cole-Hopf. Cette approche, dite approche des structures de régularité, va bien au-delà de l'équation KPZ et elle peut notamment être utilisée pour donner un sens aux EDPS qui ont été proposées en physique pour décrire les fluctuations à grande échelle de systèmes critiques [20]. Il est impossible d'entrer dans les détails des travaux de Hairer et de toute la littérature qu'un tel résultat a déclenchée. Nous mentionnons simplement les approches alternatives dans [15, 16, 14, 25] et le fait que les termes divergents dans (9) et (10) sont présents dans toutes ces théories. De plus, et pour rendre justice à la physique, même si l'équation KPZ a été écrite sous la forme (7), une analyse des étapes de calcul montre clairement que $(\nabla h)^2$ ne doit pas être pris littéralement et que une procédure de régularisation (cut-off dans l'espace de Fourier) est appliquée et une constante divergente est soustraite (procédure de renormalisation).

2.4. KPZ et les systèmes désordonnés

Un des arguments utilisés dans [23] pour justifier la prédiction du comportement d'échelle $(t^{1/3}, t^{2/3})$ dont nous avons discuté passe par un autre modèle qui a priori ne semble pas avoir grand chose à voir avec les interfaces croissantes : c'est un modèle désordonné, le modèle d'un Polymère Dirigé en Milieu Aléatoire (PDMA). Nous sommes donc dans le cadre de ce que nous avons discuté à la Section 1 et de ce que nous allons reprendre à la Section 3.

Considérons par exemple une marche aléatoire symétrique $S_n=X_1+X_2+\ldots X_n$ qui en un temps 1 ne peut que monter ou descendre d'un pas, ou rester là où elle est. Plus précisément on choisit les variables aléatoires $(X_j)$ indépendantes et de la même distribution : $\mathbf P(X_j=1)= \mathbf P(X_j=0)=\mathbf P(X_j=-1)=1/3$ pour chaque $j$, voir Fig. 3. La probabilité d'une trajectoire donnée qui relie $(0,0)$ à $(n,k)$, avec $\vert k\vert \le n$, est donc $(1/3)^n$. Modifions maintenant cette probabilité en introduisant un désordre trempé (quenched) sous la forme d'un environnement aléatoire : nous imaginons que sur chaque site de $(n,k)\in\mathbb Z^2$ (ou sur chaque site du cône intéressé par les trajectoires de la marche aléatoire : Fig. 3) il y a une énergie $\varepsilon_{n,k}$. La probabilité d'un chemin donné $(0, s_1,\ldots, s_n)$ jusqu'au temps $n$ est pondérée par le poids de Boltzmann $\exp(\beta \sum_{j=1} ^n \varepsilon_{j,s_j})$. Puisque nous parlons de probabilités, nous devrons normaliser le poids de Boltzmann en divisant par ce qu'on appelle normalement fonction de partition, c'est-à-dire la somme de $\exp(\beta \sum_{j=1}^n \varepsilon_ {j,s_j})/3^n$ sur les $3^n$ différents chemins que peut emprunter la marche. Il n'est pas difficile de se rendre compte que nous avons peut-être modifié notre modèle de manière considérable. Pensez par exemple à la limite de $\beta=\infty$ : dans ce cas les chemins qui ne maximisent pas l'énergie totale $ \sum_{j=1}^n \varepsilon_{j,s_j}$ auront une probabilité nulle !

qsf
Figure 3. Dans le modèle PDMA, la trajectoire de la marche aléatoire (cette fois nous avons choisi une marche simple paresseuse : elle monte ou descend d'une marche, ou elle reste sur place) recueille les contributions de l'environnement. Dans ce cas l'environnement ne prend que trois valeurs : $0$ pour les cercles vides, $+1$ pour les cercles grisés, $+2$ pour les cercles noirs. Ainsi la trajectoire bleue collecte une énergie totale de $12$ et elle aura une probabilité plus élevée que la trajectoire rouge qui ne collecte qu'une énergie de $8$ : le rapport des deux probabilités est $\exp(4 \beta)$.

Maintenant, nous choisissons les énergies de manière désordonnée, c'est-à-dire que nous choisissons $(\varepsilon_{n,k})$ une réalisation d'une famille de variables aléatoires indépendantes et identiquement distribuées (et indépendantes de la marche aléatoire), par exemple des variables aléatoires discrètes comme dans la Fig. 3 (mais choisissez des variables gaussiennes standard si vous préférez). C'est ainsi que nous définissons le modèle PDMA. Soulignons encore une fois la nature différente des deux aléas présents dans un modèle désordonné : le désordre $(\varepsilon_{n,k})$ qui est quenched (choisi une fois pour tout au début de l'expérience) et la marche aléatoire qui est, par contre, libre de fluctuer.

Pourquoi Kardar, Parisi et Zhang invoquent-ils le PDMA dans [23] ? Pour faire court, les exposants $(1/3, 2/3)$ étaient déjà prédits pour le PDMA : notamment, alors qu'il est bien connu que $S_n$ à un comportement d'échelle proportionnel à $n^{1/ 2}$, dans le cadre du modèle PDMA, les physiciens ont prédit un comportement surdiffusif en $n^{2/3}$ (et dans certains cas, cela est rigoureusement prouvé, voir [8] et les références qu'il contient). Mais quel est le lien entre PDMA et modèles de croissance ? Nous répondons à cette question en observant que si on considère la fonction de partition entre deux points
$$
Z_n(x)\,:=\, \sum_{s: (0,0) \leftrightarrow (n,x)} \exp\left(\beta \sum_{j=1}^n \varepsilon_{j,s_j}\right)\, ,
 $$

où la somme est sur tous les chemins de marche aléatoires qui relient $(0,0)$ à $(n, x)$, alors on voit bien que si on pose $h_n(x):= (1/ \beta) \log Z_n(x)$ pour $\vert x \vert < n$ on a
$$
h_{n+1}(x) \, =\, \frac 1 \beta \log \left( e^{\beta h_n(x-1)}+ e^{\beta h_n(x)} +e^{\beta h_n(x+1)} \right)
 + \varepsilon_{n+1,x}\, ,
$$

 et l'on voit que $h_n(x)$ décrit un modèle de croissance. Ceci devient plus évident dans la limite $\beta \to \infty$:
 $$
 h_{n+1}(x) \, =\, \max\left( h_n(x-1), h_n(x) , h_n(x+1)\right)+ \varepsilon_{n+1,x}\, .
 $$

Dans ce cas on peut apprécier à la fois le mécanisme de croissance (similaire au modèle de dépôt balistique, c'est-à-dire le modèle 2 de Fig. 2) et le mécanisme de lissage. Compte tenu de cela, nous pouvons aussi voir le modèle KPZ (7) comme un modèle désordonné : $\eta$ correspond aux variables désordonnées $\varepsilon$ et la marche aléatoire est cachée dans le Laplacien (le générateur du mouvement brownien) de (7). Nous terminons cette discussion sur KPZ et PDMA en remarquant qu'il est possible de retrouver la distribution de Tracy-Widom pour KPZ en appliquant la méthode des répliques (Sec. 1) et à ce propos nous citons l'intéressante discussion dans [9, dernier paragraphe de la Sec. 1.1].

3. La réduction dimensionnelle par Parisi et Sourlas

Nous terminons ce voyage dans les travaux de Parisi en présentant une de ses prédictions qui s'est révélée inexacte. Pour cela, on revient au modèle d'Ising défini au début de la section 1.1 et on introduit un désordre consistant en un champ extérieur aléatoire : pour $\eta=(\eta_x)_{x \in \mathbb Z^d}$ une collection de variables gaussiennes standard indépendantes et $J>0$, on définit le hamiltonien
$$
 H_{N, \eta, \varepsilon}(\sigma)\,:=\,\frac J 2 \sum_{\substack{x, y \in \Lambda_N : \\ x \sim y}} \sigma_x \sigma_y + \varepsilon \sum_{x \in \Lambda_N}\eta _x \sigma_x\, .   \quad (11)
$$

Les physiciens Yoseph Imry et Shang-keng Ma ont présenté en 1975 [21] un argument montrant qu'en dimension $d\ge 3$ la transition de phase du premier ordre décrite pour le modèle d'Ising dans la section 1.1 subsiste à l'introduction du désordre, au moins lorsque $\varepsilon>0$ est suffisamment petit et $J$ suffisamment grand (on a choisi ici $\beta=1$). Avec Nicolas Sourlas, Giorgio Parisi a fourni en 1979 [35] un argument de théorie des champs - il suffit de lire le titre de l'article [35] pour se convaincre qu'il s'agit d'un argument plutôt audacieux - suggérant qu'une telle transition disparaît pour $d\le 3$ : les deux arguments sont donc incompatibles si $d=3$. En effet, Parisi et Sourlas ont remarqué que les diagrammes pertinents (au sens des développements de la théorie des champs, i.e. les termes dominants du développement) du modèle en dimension $d$ auquel on ajoute un champ extérieur désordonné correspondent aux diagrammes pertinents du même système en dimension $d-2$ mais sans désordre. Donc si la transition est présente dans le modèle de dimension $d-2$ non désordonné, le modèle $d$ dimensionnel désordonné a une transition et, de plus, le comportement critique est le même. Dans le cas que l'on traite dans cette section, il suffit de remarquer que $d-2=1$ et le modèle d'Ising unidimensionnel n'a pas de transition de phase : donc le modèle en dimension 3 avec désordre n'a pas de transition de phase. Cette prédiction a provoqué de très vifs débats dans la communauté des physiciens, plusieurs articles soutenant respectivement la prédiction de Imry et Ma et celle de Parisi et Sourlas. Ce sont finalement Jean Bricmont et Antti Kupiainen qui ont tranché le débat en 1988 en faveur d'Imry et Ma, dans un remarquable article utilisant des arguments de développements en clusters.

Cela montre bien sûr que les prédictions audacieuses de Parisi peuvent être fausses. Mais ce n'est pas tout : Parisi et Sourlas ont appliqué leur idée au-delà du contexte du modèle d'Ising avec champ aléatoire [36,37]. Notamment, ils ont lié des modèles de polymères ramifiés auto-évitants en dimension $d$ à un modèle d'Ising en dimension $d-2$, avec un champ extérieur non aléatoire, mais complexe (i.e., $h \in \mathbb C$).

Afin d'être plus précis, nous commençons par définir le modèle de polymères ramifiés auto-évitants. Un polymère ramifié auto-évitant dans $\mathbb Z^d$ se définit via un ensemble fini de points distincts $x_1, \ldots , x_N \in \mathbb Z^d$ et un arbre (i.e. un graphe connexe sans boucles) de sommets $x_1, \ldots, x_N$ dont les arêtes $\{x_j , x_k\}$ sont aussi des arêtes de $\mathbb Z^d$. En identifiant deux polymères ramifiés s'ils différent d'une translation, on peut alors compter le nombre $c_N$ de polymères ramifiés auto-évitant à $N$ sommets. On voit facilement que $c_1=1$, $c_2=2$, $c_3=6$. On s'attend à l'asymptotique $c_N= N^{-\theta+o(1)} \lambda^N$ lorsque $N\to \infty$ avec $\theta=\theta(d)$ universel (i.e. indépendant de la structure locale du réseau), contrairement au paramètre $\lambda$. Par exemple, en dimension $2$, $\theta$ devrait être le même pour les réseaux carrés et triangulaires. Dans [36], Parisi et Sourlas ont pu calculer le paramètre $\theta$ en le reliant à la singularité de Lee-Yang (plus précisément Lee-Yang edge singularity [26, 13]) du modèle d'Ising en dimension $d -2$. Cette singularité apparaît dans la densité des zéros de la fonction de partition du modèle d'Ising
$$
Z_{N, \beta, h}\, =\, \sum_{\sigma\in \{-1, +1\}^{\Lambda_N}} \exp\left( \beta H_N (\sigma) \right)\,,
$$

où $H_N (\sigma)$ est défini dans (1) mais cette fois $h$ est un nombre complexe. La célèbre théorie de Lee-Yang étudie la transition de phase du modèle d'Ising en remarquant que $F_N(\beta, h):=(1/\vert \Lambda _N \vert) \log Z_{N, \beta, h}$ est une fonction analytique réèlle de $h$ (ainsi que de $\beta$, mais nous gardons $\beta>0$ fixé) puisque $Z_{N, \beta, h}$ est un polynôme en $e^{\beta h}$ et $e^{\beta J} $. La seule singularité en $h$ possible à la limite $N \to \infty$ correspond à des zeros de $Z_{N, \beta, h}$ approchant l'axe réel. En particulier, en dimension $d=1$, l'absence de transition de phase implique que les zéros $F_N(\beta, h)$ restent éloignés de l'axe réel lorsque $N\to \infty$. Le même phénomène se produit pour les petites valeurs de $\beta$ en dimensions supérieures. Néanmoins, on peut tout de même regarder les singularités de $F_N(\beta, h)$ dans le plan complexe (même si elles n'approchent pas l'axe réel) et la singularité de Lee-Yang est définie comme la singularité la plus proche de l'axe réel (dans le cas que l'on considère, il existe deux singularités à deux valeurs complexes conjuguées et de même comportement). L'aimantation du système en volume infini, c'est-à-dire $\partial_h F_N(\beta,h)$ dans la limite $N \to \infty$, devrait alors se comporter comme $(h-h_0(\beta))^{\varsigma}$ lorsque $h$ tend vers la singularité de Lee-Yang $h_0(\beta)$, avec $\varsigma=\varsigma(d)$. Parisi et Sourlas prédisent
$$
\theta(d)\, =\, \varsigma (d-2)+2\, .  \quad (12)
$$

On peut montrer que $\varsigma(1)=-1/2$ en écrivant la fonction de partition du modèle d'Ising unidimensionnel comme la trace de la matrice de transfert du modèle - une matrice de taille $2\times 2 $ - élevé à la puissance de la longueur du système. En dimension zéro, le calcul se fait sur un seul site - $Z= \exp(\beta h)+\exp(-\beta h)$ - et $Z$ ne dépend pas de $N$, ce qui permet de conclure que $ \varsigma(0)=-1$. La situation diffère sensiblement en dimension $d\ge 2$ : on ne connaît pas d'expression suffisamment explicite pour la fonction de partition en dimension $d\ge 2$ et $h\in \mathbb C$.

Les résultats $\varsigma(0)=-1$ et $\varsigma(1)=-1/2$ obtenus par de calculs élémentaires impliquent, via la formule de Parisi-Sourlas (12), les prédictions (pas du tout élémentaires) $\theta( 2)=1$ et $\theta(3)=3/2$. Ces prédictions ont été prouvées par David Brydges et John Imbrie en 2003 [7] pour une version continue du modèle de polymères ramifiés auto-évitant : la preuve utilise l'équivalence entre le modèle de polymères et celui d'un gaz continu de particules à noyau dur. Ceci confirme la validité de l'argument de réduction dimensionnelle de Parisi et Sourlas au moins dans ce cas précis, ce qui étaye la validité de réduction de dimension de Parisi et Sourlas aux yeux des mathématiciens (l'argument de Parisi et Sourlas ayant toujours été pris très au sérieux par les physiciens).

La question du champ d'application de l'argument de Parisi et Sourlas et des conditions dans lequel il devient erroné restent un sujet de recherche important en physique, mais elles sont aussi une vaste source de questions stimulantes pour la communauté mathématique, à l'image de l'ensemble des travaux de Giorgio Parisi.

Références

[1] G. Amir, I. Corwin and J. Quastel, Probability distribution of the free energy of the continuum directed random polymer in 1+1 dimensions, Comm. Pure Appl. Math. 64 (2011), 466-537.
[2]  J. Baik, P. Deift and K. Johansson, On the distribution of the length of the longest increasing subse- quence of random permutations, J. Amer. Math. Soc. 12 (1999), 1119-1178.
[3]  L. Bertini and G. Giacomin, Stochastic Burgers and KPZ equations from particle systems, Comm. Math. Phys. 183 (1997), 571-607.
[4]  E. Bolthausen, On the proof of the Parisi formula by Guerra and Talagrand, S ́eminaire Bourbaki. Vol. 2004/2005. Ast ́erisque No. 307 (2006), Exp. No. 948, ix, 349-377.
[5]  A. Bovier, Statistical mechanics of disordered systems. A mathematical perspective, Cambridge Series in Statistical and Probabilistic Mathematics, 18, Cambridge University Press, 2006.
[6]  J. Bricmont and A. Kupiainen, Phase transition in the 3d random field Ising model, Comm. Math. Phys. 116 (1988), no. 4, 539-572.
[7]  D. C. Brydges and J. Z. Imbrie, Branched polymers and dimensional reduction, Ann. of Math. 158 (2003), 1019-1039.
[8]  F. Comets, Directed polymers in random environments, Lecture notes from the 46th Probability Sum- mer School held in Saint-Flour, 2016, Lecture Notes in Mathematics, 2175 Springer, 2017.
[9]  I. Corwin, The Kardar-Parisi-Zhang equation and universality class, Random Matrices Theory Appl. 1 (2012), no. 1, 1130001, 76 pp.
[10]  B. Derrida, Random energy model: An exactly solvable model of disordered systems, Phys. Rev. B 24 (1981), 2613-2626.
[11]  B. Derrida, The discovery of the broken symmetry of replicas, J. Phys. A, 49 (2016), 451001.
[12]  S. F. Edwards and P. W. Anderson, Theory of spin glasses, J. Phys. F: Metal Physics, 5 (1975),  965-974.
[13]  M. E. Fisher,Yang-Lee edge singularity and φ3 field theory, Phys. Rev. Lett. 40 (1978), 1610.
[14]  P. Gonc ̧alves and M. Jara, Nonlinear fluctuations of weakly asymmetric interacting particle systems,  Arch. Ration. Mech. Anal. 212 (2014), 597-644.
[15]  M. Gubinelli, P. Imkeller, and N. Perkowski, Paracontrolled distributions and singular PDEs, Forum Math. Pi 3 (2015), e6, 75.
[16]  M. Gubinelli and N. Perkowski, KPZ reloaded, Comm. Math. Phys. 349 (2017), 165-269.
[17]  F. Guerra, Broken replica symmetry bounds in the mean field spin glass model, Comm. Math. Phys. 233 (2003), 1-12.
[18]  F. Guerra and F. L. Toninelli, The thermodynamic limit in mean field spin glass models, Comm. Math. Phys. 230 (2002), 71-79.
[19]  M. Hairer, Solving the KPZ equation, Ann. of Math. (2) 178 (2013), 559-664.
[20]  M. Hairer, A theory of regularity structures, Invent. Math. 198 (2014), 269-504.
[21]  Y. Imry and S. K. Ma, Random-field instability of the ordered state of continuous symmetry, Phys. Rev. Lett. 35, 1399-1401 (1975)
[22]  K. Johansson, Shape fluctuations and random matrices, Comm. Math. Phys. 209 (2000), 437-476.
[23]  M. Kardar, G. Parisi and Y.-C. Zhang, Dynamic scaling of growing interfaces, Phys. Rev. Lett. 56 (1986), 889.
[24]  J. Krug and H. Spohn, Kinetic roughening of growing surfaces, in ”Solids far from equilibrium: Growth, morphology and defects”, C. Godreche ed. Cambridge: Cambridge University Press, 1991.
[25]  A. Kupiainen and M. Marcozzi, Renormalization of generalized KPZ equation, J. Stat. Phys. 166 (2017), 876-902.
[26]  T. D. Lee and C. N. Yang, Statistical theory of equations of state and phase transitions. II. Lattice gas and Ising model, Phys. Rev. 87 (1952), 410-419.
[27]  M. Mézard and A. Montanari, Information, physics, and computation, Oxford Graduate Texts, 2009.
[28]  M. Mézard and G. Parisi, The cavity method at zero temperature, J. Statist. Phys. 111 (2003), 1-34.
[29]  M. Mézard, G. Parisi, and M. Virasoro, Spin Glass Theory and Beyond, World Scientific Lecture Notes in Physics 9, World Scientific Publ. Co., Inc., Teaneck, NJ, 1987.
[30]  C. M. Newman and D. L. Stein, Short-range spin glasses: results and speculations, Spin glasses, 159-175, Lecture Notes in Math., 1900, Springer, 2007.
[31]  D. Ruelle, A mathematical reformulation of Derrida’s REM and GREM, Comm. Math. Phys. 108 (1987), 225-239.
[32]  D. L. Stein and C. M. Newman, Spin glasses and complexity, Primers in Complex Systems. Princeton University Press, 2013.
[33]  D. Panchenko, The Parisi ultrametricity conjecture, Ann. of Math. 177 (2013), 383-393.
[34]  G. Parisi, A sequence of approximate solutions to the S-K model for spin glasses, J. Phys. A 13 (1980), L115.
[35]  G. Parisi and N. Sourlas, Random magnetic fields, supersymmetry, and negative dimensions, Phys. Rev. Lett. 43 (1979), 744-745.
[36]  G. Parisi and N. Sourlas, Critical behavior of branched polymers and the Lee-Yang edge singularity, Phys. Rev. Lett. 46 (1981), 871.
[37]  G. Parisi and N. Sourlas, Supersymmetric field theories and stochastic differential equations, Nucl. Phys. B 206 (1982), 321-332 .
[38]  G. Parisi, Order parameter for spin-glasses, Phys. Rev. Lett. 50 (1983), 1946-1948.
[39]  T. Sasamoto and H. Spohn, One-dimensional Kardar-Parisi-Zhang equation: an exact solution and its universality, Phys. Rev. Lett. 104 (2010), 230602.
[40]  D. Sherrington and S. Kirkpatrick, Solvable model of a spin glass, Phys. Rev. Lett. 35 (1975), 1792-1796.
[41]  M. Talagrand, The Parisi formula, Ann. of Math. 163 (2006), 221-263.
[42]  M. Talagrand, Mean field models for spin glasses. Volume I. Basic examples, A Series of Modern Surveys in Mathematics 54, Springer, 2011.
[43]  M. Talagrand, Mean field models for spin glasses. Volume II. Advanced replica-symmetry and low temperature, A Series of Modern Surveys in Mathematics 55, Springer, 2011.
[44]  C. A. Tracy and H. Widom, Level-spacing distributions and the Airy kernel, Comm. Math. Phys. 159 (1994), 151-174.

 

Contact

Giambattista Giacomin est professeur à Université de Paris, membre du laboratoire de probabilités, statistique et modélisation (LPSM) (UMR8001 - CNRS, Sorbonne Université, Université de Paris).