Sommaire Qu'est-ce que la théorie des modèles ?




La théorie des modèles est une branche de la logique mathématique. Le but de cette page est d'aller un peu au-delà de cette première définition sommaire. L'entreprise étant de vulgarisation, je n'ai pas cherché à être exhaustif ni élitiste, mais j'ai essayé quand c'était possible d'inclure quelques preuves choisies parmi les plus élémentaires, afin d'illustrer un peu mon propos.
La plupart des livres d'introductions à la théorie des modèles rebutent le lecteur par d'interminables (mais indispensables) bavardages sur le formalisme de la logique du 1er ordre (la seule dont il sera question ici). La plupart aussi incluent des gloses nombreuses (et beaucoup moins indispensables) sur le passé de la théorie, dont le glorieux théorème de Gödel. Mon but ici n'est pas de démontrer rigoureusement quoi que ce soit, ni de démonter les fins rouages des fondements des mathématiques, mais au contraire d'utiliser la compréhension intuitive de ce formalisme (quantificateurs...etc.) que tout mathématicien contemporain a acquis à l'usage, pour donner un aperçu heuristique de quelques questions et résultats modernes de cette branche un peu exotique des mathématiques.
Le lecteur est donc prévenu : il n'y aura dans cet exposé à peu près aucun formalisme. Faute de formalisme, il n'y aura non plus aucune précision, et sans précision il n'y a pas de rigueur possible. À bon entendeur...!

« Les mathématiciens n'ont pas le privilège de la rigueur, ils ont seulement celui de la précision. »
Citation approximative de HEIDEGGER

« Seuls les métaphysiciens sont capables de rigueur dans le vague, laissez-leur ce privilège. »
MOI (à mes élèves, en TD)

Prérequis :



Sommaire :

Présentation
L'Histoire ancienne
Définitions
Exemples
Mais, mais, mais...!?
Autour du théorème de compacité
Quand une théorie a-t-elle des modèles ?
Y a-t-il des corps vraiment très grands ?
Conclusion sur le théorème de compacité
Un pas vers la stabilité
Exemple des Q-espaces vectoriels
Exemple des corps algébriquement clos
Le théorème de Morley
De la théorie des modèles à l'algèbre
Ultraproduits, ultrapuissances
Exemples, véracité presque partout
Au-delà des corps valués complets
Le principe de transfert d'Ax-Kochen, et applications
Conclusion




Présentation

  1. L'Histoire ancienne :
    Le sens général du mot « logique » est selon le Lalande (Dictionnaire technique et critique de la philosophie) la « science ayant pour objet le jugement d'appréciation en tant qu'il s'applique à la distinction du Vrai et du Faux ». À ce projet métaphysique un peu flou se rattache l'étude plus modeste des règles formelles de déductions communes à toute tentative de prouver quelque chose. On voit le lien avec l'activité mathématique...

    Cette étude du formalisme des démonstrations a été initiée par les grecs (qui ont aussi inventé le raisonnement axiomatique). Mais elle est restée à l'état embryonnaire pendant des siècles : la classification des 256 syllogismes d'Aristote est longtemps passée pour ce qu'on pouvait faire de mieux dans le genre (Kant dit quelque part que la logique est une science parfaite, mais parfaitement achevée depuis son origine).


    Devinette : trouvez qui est qui dans la galerie de portraits ci-dessus (ce sont, dans le désordre, les sept mathématiciens cités ci-après ; pour obtenir une réponse cliquez sur l'image).

    Ce n'est que dans la deuxième moitié du XIXe siècle que les travaux de Cantor, Frege, Peano, Hilbert, Zermelo, Russell, Fraenkel (par ordre chronologique, et j'en oublie surement) sur les fondements des mathématiques et/ou sur la théorie des ensembles ont permis d'opérer une vaste réorganisation de cette discipline. Grâce à leurs efforts, le formalisme mathématique atteignit un niveau suffisant pour qu'on puisse commencer à raisonner dessus sans se prendre les pieds dans le tapis ! La logique mathématique a alors pris son essor et s'est définitivement séparée de la philosophie.

    Le théorème d'incomplétude de Gödel (1931) peut être considéré comme l'acte de naissance de cette nouvelle discipline. Bien entendu ce choix contient une part d'arbitraire, mais l'extraordinaire retentissement de ce théorème, même au-delà des mathématiques, en fait un repère naturel. Depuis, la logique formelle s'est développée dans plusieurs directions, que l'on peut ranger sommairement en une partie « informatique fondamentale » et une partie « mathématiques pures ». La première connait depuis quelques temps un engouement indéniable, on y range diverses sous-disciplines telles que le lambda-calcul, la théorie de la démonstration...etc. Le regrettable cloisonnement des sciences modernes étant ce qu'il est, je dois avouer que je ne connais pas grand chose à ces domaines pourtant voisins du mien (soupir...). La partie « mathématiques pures » de la logique est celle dont je veux parler maintenant.

  2. Nouvelle définition :
    J'appelle « théorie des modèles » cette partie de la logique contemporaine qui est de mathématique pure. Son objet est l'étude du rapport entre les théories et leurs modèles.
    Petite explication de texte :

    Langage
    On appelle ainsi un ensemble de symboles. Ces symboles peuvent être de trois types : constantes, fonctions, relations. Un symbole de relation s'appelle aussi un prédicat.

    Théorie (du 1er ordre)
    Les formules du 1er ordre dans un langage donné sont construites par récurrence, en combinant suivant des règles syntaxiques fixées les éléments du langage et quelques autres symboles indépendants (l'égalité, les connecteurs booléens "et", "ou", "non", les quantificateurs "A" et "E", et un ensemble infini de symboles de variables).
    On appelle alors théorie (du 1er ordre) tout ensemble de formules (du 1er ordre) dans un langage donné.

    La façon exacte dont on construit ces formules est parfaitement triviale pour un mathématicien contemporain : on les construit comme on en a l'habitude ! (cf. exemples plus loin.)
    Il y a cependant deux restrictions fondamentales :
    • Les quantificateurs ne peuvent porter que sur les variables (on ne peut pas dire « il existe une fonction » ou « pour tout entier n » au premier ordre).
    • On ne spécifie pas l'ensemble dans lequel on quantifie les variables (ie. on dit « pour tout x il existe y » et pas « pour tout x appartenant à R il existe y appartenant à Q »).
    Ces restrictions sont importantes, ce sont elles qui caractérisent la logique du premier ordre (dans celle du second ordre il est permis de quantifier par exemple sur des parties, et d'écrire par une formule "il existe une fonction telle que..."). Nous ne considérons ici que les formules et les théories du premier ordre, et cette précision sera sous-entendue dans toute la suite.
    Note :
    • Le lecteur aura compris que pour la commodité de l'écriture j'ai remis à l'endroit les symboles de quantificateurs qu'on a l'habitude de noter renversés : "A" pour "quel que soit" et "E" pour "il existe".
    • Avec les connecteurs "et", "ou", "non", on peut en construire d'autres : l'implication "P --> Q" est définie comme un raccourcit pour "(non P) ou Q", et de même pour l'équivalence "<-->".

    Structure
    Considérons un langage L composé d'un symbole de constante "c", d'un symbole de fonction "f" d'arité 3 (l'arité d'un symbole de fonction ou d'un prédicat est son nombre de variable) et d'un symbole de relation binaire "R" (i.e. un prédicat d'arité 2). Munir un ensemble E d'une L-structure (ou interprétation de L) c'est simplement choisir un élément cE de E, une fonction fE de E×E×E dans E et une partie RE de E×E.

    Modèle
    Reprenons notre langage L et notre L-structure (E, cE, fE, RE) que nous noterons E par abus de langage. À votre avis quand dira-t-on que la formule suivante est satisfaite dans E :

    A y, E x, E x', E x'',   f(x,x',x'')=y

    Quand la fonction fE est surjective ? Bravo, vous avez tout compris !
    On dit qu'une structure E est modèle d'une théorie T, ou qu'elle satisfait T si toute formule de T est satisfaite dans E (au sens de l'exemple ci-dessus).

    Note :

    • La satisfaction d'une formule (par une structure) est en fait définie par récurrence, selon les mêmes règles qui prévalent pour la construction des formules. Par exemple, si on a déjà défini ce que voulait dire « satisfaire la formule "F" » et « satisfaire la formule "G" » pour une structure quelconque, on posera par définition qu'une structure satisfait la formule "F et G" si et seulement si elle satisfait "F" et elle satisfait "G".
    • Ce genre de banalités ne nécessite pas qu'on s'y attarde, puisqu'au bout du compte on obtient ce que n'importe qui connait instinctivement...

  3. Exemples
    Quand je parle de « la » théorie des ensembles, je veux parler des axiomes de Zermelo-Fraenkel  avec l'axiome du choix  (c'est indispensable pour pouvoir parler du cardinal d'un ensemble quelconque, comme nous le ferons constamment par la suite).
    Quand une classe de structures dans un langage L coïncide avec la classe des modèles d'une théorie, comme on vient de le voir pour les groupes, on dit qu'elle est axiomatisable dans ce langage. Par exemple la classe des anneaux, ou celle des corps est axiomatisable dans le langage des anneaux. En revanche la classe des corps finis, ou des sous-corps de C n'y est pas axiomatisable (nous verrons plus loin pourquoi).

  4. Mais, mais, mais...!?
    Vous avez l'impression qu'on s'est fichu de vous ? Les définitions ci-dessus ont l'air de lapalissades parfaitement stériles. Que pourrait-on bien montrer d'interessant avec ça ?
    Ne vous y fiez pas. La présentation de ces objets (nous ne les avons même pas définis rigoureusement) est un passage obligé pour énoncer n'importe quelle question de logique d'aujourd'hui (sans même parler d'une réponse). On peut dire que les formules sont aux théoriciens des modèles ce que les polynômes sont aux algébristes : essayez donc de faire comprendre l'interêt des polynômes (objets construits suivants des règles formelles à la fois abstraites et triviales) à quelqu'un qui connait les nombres, sait les multiplier et les additionner, mais n'a pas la plus petite notion d'algèbre moderne !
    L'interêt de ces constructions ne peut apparaître que sur des exemples « concrets ». J'espere que la selection suivante remplira ce rôle.


Don't panic !


Autour du théorème de compacité

  1. Quand une théorie a-t-elle des modèles ?
    Notons "FAUX" la formule "E x, non(x=x)".
    Il est clair qu'une formule absurde (mais syntaxiquement correcte) telle que "FAUX" ne peut être vérifiée dans aucune structure. Une condition nécessaire pour qu'une théorie admette au moins un modèle est donc qu'elle ne contienne pas la formule "FAUX".
    Mais cela n'est pas suffisant : soit T une théorie et C(T) l'ensemble des conséquences de T, c'est-à-dire l'ensemble des formules qu'on peut déduire de celles de T en un nombre fini d'opérations logiques élémentaires telles que : Il est clair que tout modèle de T est aussi modèle de C(T) : la notion de satisfaction d'une formule par une structure a été définie précisément pour qu'on ait cette propriété. (Par exemple nous avons dit plus haut que si une structure satisfait "A et B" alors elle satisfait "A" et "B".) Il s'ensuit que pour qu'une théorie ait un modèle il est nécessaire que C(T) en ait un, et donc que "FAUX" n'appartienne pas à C(T).
    Tout cela est immédiat ; ce qui l'est moins, c'est que la réciproque est vraie aussi !
    Théorème (de complétude).
    Une théorie T a un modèle si et seulement si "FAUX" n'est pas conséquence de T.
    Il est hors de question de donner ici la preuve de ce théorème, que le lecteur interessé trouvera dans tout manuel de théorie des modèles. Non qu'elle soit abominable (c'est une des premières qu'on voit en DEA) mais elle exigerait de détailler pas mal de choses dont je n'ai pas envie de parler ici... après tout cette page n'est qu'une présentation sommaire !
    En attendant, nous allons voir quelques applications.

    Une théorie est dite consistante si on ne peut en déduire "FAUX", et contradictoire sinon. Elle est dite satisfaisable si elle a un modèle. En vertu de ce qui précède les deux notions (consistance ou satisfaisabilité) coïncident.
    Ce ne serait pas vrai avec d'autres logiques que celle du premier ordre !!
    L'application suivante du théorème de complétude est sans nulle doute la plus utilisée de la théorie des modèles.

    Théorème (de compacité).
    Une théorie T est satisfaisable si et seulement si elle est finiment satisfaisable (ie. si toute partie finie de T a un modèle).
    Preuve : Une implication est triviale : si T a un modèle celui-ci satisfait toutes les formules de T, et donc est aussi modèle de tout sous-ensemble fini de formules de T.
    Réciproquement, si T n'a pas de modèle alors d'après le théorème de complétude la formule "FAUX" est conséquence de T. Mais les règles de déduction des formules permettent à chaque fois de déduire une formule d'un nombre fini de formules. Or pour déduire "FAUX" de T on n'avait droit qu'à des preuves finies, c'est-à-dire que "FAUX" a dû être déduite de T en un nombre fini d'étapes. Chacune de ces étapes faisant intervenir un nombre fini de formules, il s'ensuit que "FAUX" a été déduite à partir d'un ensemble fini T' de formules de T. Autrement dit T' est contradictoire, donc n'a pas de modèle, et donc T n'est pas finiment satisfaisable.

    Le théorème de compacité est un moyen puissant de construire des modèles d'une théorie. Nous allons en donner tout de suite une application.

  2. Y a-t-il des corps vraiment très grands ?
    Dans une catégorie où il existe des produits (comme celle des groupes ou des anneaux, par exemple) il est facile de construire des objets de cardinal arbitrairement grand. Par exemple, si vous avez un ensemble infini E de cardinal Kappa, Z(E) (l'ensemble des fonctions de E dans Z à support fini) est un anneau de cardinal Kappa.
    Pour les corps, cette méthode ne marche pas (parce qu'un produit de deux corps et plus n'est pas un anneau intègre). On peut très bien s'en sortir en remarquant que le corps des fractions rationnelles à coefficients dans Q en Kappa indéterminées est de cardinal Kappa.
    Mais plus généralement, ne pourrait-on pas conjecturer qu'une structure algébrique raisonnable doit avoir des représentants de cardinal arbitrairement grand ? Ne pourrait-on pas trouver un moyen de construction uniforme ?
    La réponse est OUI, si l'on remplace « raisonnable » par « axiomatisable », et le théorème de compacité fournit ce moyen : on introduit un ensemble de constantes de cardinal arbitraire, qui joue un rôle semblable à celui joué par les indeterminées dans l'exemple des corps ci-dessus.
    Théorème (de Löwenheim-Skolem montant).
    Soit Kappa un cardinal arbitrairement choisi.
    Si une théorie possède un modèle infini, alors elle possède un modèle de cardinal superieur ou égal à Kappa.
    Preuve : Soit T une telle théorie dans un langage L, et soit X un ensemble de nouveaux symboles de constantes, de cardinal Kappa. Dans le langage L' formé par la réunion de L et de X, on considère la théorie T' obtenue en rajoutant à T les formules "non(c=d)" pour toute paire de symboles distincts {c,d} appartenant à X. Un modèle de T' n'est rien d'autre qu'un modèle de T dans lequel on a choisi Kappa éléments distincts pour interpréter les Kappa symboles de X. Il est clair que la L-structure sous-jacente à un tel modèle est un modèle de T de cardinal supérieur ou égale à Kappa. Il suffit donc, pour prouver le théorème, de montrer que T' est satisfaisable.
    Soit F' un fragment fini de T'. Il fait intervenir un fragment fini F de T, plus un nombre fini de formules "non(c=d)" donc un ensemble fini {c1,...,cn} de symboles de X. Pour construire un modèle de F', il suffit donc de trouver un modèle de F (et tout modèle de T fera l'affaire) et de le munir d'une (L union {c1,...,cn})-structure en interprétant les symboles {c1,...,cn} par n éléments distincts choisis dans ce modèle. N'importe quel modèle de T fera l'affaire du moment qu'il possède n éléments distincts, ie. qu'il est de cardinal plus grand que n. Or par hypothèse T possède un modèle infini. F' est donc satisfaisable.
    Nous venons de montrer que tout fragment fini F' de T' était satisfaisable. Par le théorème de compacité T' a donc elle-même un modèle, d'où la conclusion.

    Remarque : Notons que la preuve montre en fait un peu plus, à savoir que pour qu'une théorie ait des modèles infinis de cardinal arbitrairement grand il suffit que pour tout entier n elle ait un modèle ayant au moins n éléments distincts.

    Corollaire.
    La classe des corps finis, comme celle des sous-corps de C, n'est pas axiomatisable.
    Preuve : Si l'une ou l'autre de ces classes était axiomatisable, elle contiendrait des modèles infinis de cardinal arbitrairement grand d'après le théorème de Löwenheim-Skolem montant (et la remarque ci-dessus), alors qu'elle n'est par définition constituée que de corps de cardinal au plus égal à celui de C.

    Note : Le « vrai » théorème de Löwenheim-Skolem est le théorème de Löwenheim-Skolem descendant, dont la preuve est beaucoup plus subtile. Celui-ci, combiné avec la version « montante » ci-dessus nous donne le théorème de Löwenheim-Skolem :

    Théorème (de Löwenheim-Skolem).
    Soit T une théorie dans un langage L, et Kappa un cardinal arbitrairement choisi, supèrieur ou égal à celui L.
    Si T admet un modèle infini, alors T admet (au moins) un modèle de cardinal Kappa.
    Ce théorème montre que si on fixe une théorie T dans un langage fini ou dénombrable et qu'on se demande :
    Quel sont les cardinaux infinis possibles pour un modèle de T ?
    La réponse, surprenante, est :
    Ou bien tous, ou bien aucun.
    Et cela sans rien savoir de ce qu'est cette théorie.

  3. Conclusion sur le compacité
    J'ai un peu menti en disant au début de cette page qu'il ne serait question que de théorie des modèles « moderne » : les notions de ce paragraphe (complétude, compacité, Löwenheim-Skolem) sont toutes « anciennes » c'est-à-dire antérieures aux années 50 (je crois) et liées aux fondements des mathématiques. Malgré tout, la portée du théorème de compacité va bien au-delà de ces questions, et il fournit un exemple assez accessible de ce que peut être un théorème absolument non trivial en logique mathématique.

    La technique employée dans le corollaire ci-dessus permet très généralement de montrer que toute propriété de caractère finitaire (par exemple être un anneau de type fini, de présentation finie, noethérien, artinien...etc) n'est pas axiomatisable. Du point de vue de l'algèbre classique on perd donc beaucoup en se restreignant aux classes de structures axiomatisables. Mais on acquière la possibilité de construire facilement des modèles.
    Il n'est pas clair qu'on gagne au change mais il arrive que ces méthodes de constructions permettent de déplacer un problème d'une structure classique (comme un sous-corps de C) dans une structure plus grande (trop grande pour l'algèbre ordinaire) où il est facile à résoudre, un peu comme il est parfois nécessaire de passer dans C pour résoudre un problème dans R. Nous verrons quelques exemples où ce passage est à ce jour la seule solution connue pour des problèmes qui ne sont même pas de théorie des modèles.

    Mais avant cela, nous allons nous pencher sur la question la plus naïve qui soit, après celles que nous venons de poser : combien une théorie a-t-elle de modèles ? Plus exactement, nous allons nous demander combien elle a de modèles infinis. Nous venons de voir que si elle en a, elle en a au moins un en tout cardinal infini (on suppose le langage de cette théorie dénombrable). Mais en un cardinal donné combien peut-elle en avoir ?


Esher


Un pas vers la stabilité

La théorie de la stabilité est le « must » de la théorie des modèles d'aujourd'hui. Elle a été inventée par Shelah et revisitée par Hrushovsky (Shelah est considéré comme le Grothendieck de la théorie des modèles, et Hrushovsky est un peu son Deligne... :-)). Les outils qu'elle utilise (inventés par Shelah) sont très généraux, très puissants, pas si abstraits que ça (comparés aux shémas ou à la cohomologie, par exemple) mais il ne nous est pas possible de les présenter assez simplement ici (du moins pour l'instant, mais j'y reviendrai un jour, j'espère). Disons que l'idée de base est de regarder, non plus globalement l'ensemble des formules satisfaites par une structure (ce qu'on appelle sa théorie) mais localement celles satisfaites par un n-uplet donné dans une structure (ce qu'on appelle son type).

Sans entrer dans ces considérations trop sophistiquées pour l'instant, nous allons présenter un résultat assez typique, dont l'énoncé a le mérite de ne pas utiliser les types (sa démonstration, si !). On commence par deux exemples.

  1. Exemple des Q-espaces vectoriels
    La classe des groupes abéliens divisibles et sans torsion est axiomatisée par la théorie des groupes abéliens plus les formules suivantes : Un Q-espace vectoriel est un groupe abélien, il est divisible et sans torsion. Inversement c'est un petit exercice que de montrer que tout groupe abélien divisible et sans torsion peut être muni d'une structure naturelle de Q-espace vectoriel. On peut donc identifier ces deux classes d'objets, et parler de la théorie des Q-espaces vectoriels (dans le langage des groupes).
    Alors si E est un Q-espace vectoriel de cardinal non dénombrable Kappa, c'est encore un petit exercice que de démontrer que toute base de E est de cardinal Kappa.
    Il s'ensuit que deux Q-espaces vectoriels quelconques de cardinal non dénombrable sont isomorphes si et seulement si ils ont même cardinal (on construit un isomorphisme en envoyant bijectivement une base sur une base).

  2. Exemple des corps algébriquement clos
    Ceux-là sont axiomatisés par la théorie des corps (commutatifs) augmentée des axiomes suivants (pour tout entier non nul d) : Considérons deux corps algébriquement clos non dénombrables K et L de même caractéristique et de même cardinal Kappa. Ils contiennent tous les deux le même sous-corps premier F (c'est Q pour la caractéristique nulle, et Fp pour la caractéristique p). Soit X (resp. Y) une base de transcendance de K (resp. L) sur F. Comme F est fini ou dénombrable, c'est un exercice du même type que précédemment que de montrer que X (et donc aussi Y) est de cardinal Kappa. Les corps F(X) et F(Y) sont donc isomorphes (note : ici X et Y ne sont pas une mais un ensemble d'indeterminées, mais ça ne change rien pour cet isomorphisme). Si on les identifie en un sous-corps M commun à K et L, on voit que K (et aussi L) est une clôture algébrique de M. Or on sait que deux clôtures algébriques d'un même corps sont isomorphes. En résumé :
    Deux corps algébriquement clos de même caractéristique et de même cardinal non dénombrable sont isomorphes.

  3. Le théorème de Morley
    Disons qu'une théorie est Kappa-catégorique, ou catégorique en un cardinal Kappa si tous ses modèles de cardinal Kappa sont isomorphes. Dans nos deux exemples précédents, on avait donc affaire à des théories catégoriques en tout cardinal non dénombrable (relisez les énoncés en italique). A priori une théorie semble pourtant pouvoir être catégorique en un cardinal Kappa et avoir plein de modèles non isomorphes en un autre cardinal Kappa'. Eh bien pas du tout !
    Théorème (de Morley).
    Si une théorie dans un langage fini ou dénombrable est catégorique en un cardinal non dénombrable alors elle l'est en tout cardinal non dénombrable.
    L'idée de la preuve (qui n'est pas du tout facile) est de définir sur deux n-uplets d'un modèle donné une notion d'indépendance, puis de base comme famille indépendante maximale, simplement à partir des formules (c'est là que les types interviennent). Il se trouve que pour une théorie catégorique en un cardinal non dénombrable, cette notion définie abstraitement se comporte bien : toutes les bases d'un modèle ont même cardinal, et tout modèle de cardinal Kappa non dénombrable possede une base de cardinal Kappa. Il est alors possible de définir un isomorphisme entre deux tels modèles de même cardinal à partir d'une bijection quelconque entre leurs bases, exactement comme dans les exemples.

    La difficulté de la preuve est de construire une notion de famille libre indépendamment de la nature exacte des structures et des langages considérés. Trouver, en quelque sorte un noyau commun à la notion d'indépendance linéaire et à celle d'indépendance algébrique ; en effet dans le cas particulier de la théorie des Q-espaces vectoriels ou de celle des corps algébriquement clos, la notion abstraite d'indépendance introduite dans la preuve du théorème se réduit bien à celles que nous connaissons. Ainsi ces deux exemples sont-ils des cas particuliers du théorème de Morley.


Montagnes


De la théorie des modèles à l'algèbre

  1. Ultraproduits, ultrapuissances
    Nous introduisons maintenant quelques définitions suplémentaires.

    Produit de structures
    Soit L un langage constitué d'un symbole de constante "c", d'un symbole de relation "R" et d'un symbole de fonction "f". Étant donnée une famille (Ei)I de L-structures indexée sur un ensemble I, on peut munir le produit PIEi (produit de (Ei)I) d'une L-structure naturelle en interprétant "c" par (cEi)I, "f" par la fonction produit des fEi, et "R" par le produit des Ri. On l'appelle la L-structure produit de la famille (Ei)I.

    Ultrafiltre
    Soit I un ensemble quelconque, et m une fonction additive non constante de l'ensemble des parties de I dans {0,1}. Autrement dit m vérifie :
    • m({}) = 0  et  m(I) = 1.
    • Si A, B sont deux parties de I disjointes alors m(A U B) = m(A) + m(B).
    En général m ne satisfait pas l'axiome d'additivité complète, ce qui ne nous empèchera pas de parler allègrement de la mesure m par abus de langage.
    On appelle ultrafiltre associé à m l'ensemble des parties de I de mesure 1 pour m. Plus généralement on appelle ultrafiltre sur I tout ensemble de parties de I construit de cette façon à partir d'une fonction additive non constante de l'ensemble des parties de I dans {0,1}.
    N.B : On définit plus souvent les ultrafiltres sur un ensemble I comme les filtres maximaux sur l'ensemble des parties de I. Les deux définitions sont équivalentes. Je préfére celle-ci car elle mets en lumière l'intuition probabiliste sous-jacente aux ultrafiltres (d'où l'abus de langage).

    Ultraproduit
    Étant donnés un langage L, une famille (Ei)I de L-structures indexées sur un ensemble I, et un ultrafiltre U sur I (issu d'une mesure m) nous dirons que deux éléments a et b de la L-structure E produit de (Ei)I sont égaux U-presque partout (en abrégé U-pp) si l'ensemble des i appartenant à I tels que a(i) = b(i) est de mesure 1 pour m, i.e. est dans U. Nous le noterons a =U b. De même, si "F" est une formule de L, on dira "F" est vraie U-presque partout si et seulement si l'ensemble des i de I tels que Ei satisfasse "F" est dans U.
    L'égalité U-pp est une relation d'équivalence sur le produit des Ei. Le quotient est noté PIEi/U. On le munit d'une L-structure naturelle en interprétant tout symbole de constante "c" (resp. de relation "R", resp. de fonction "f") par l'image de cE (resp. l'image directe de RE, resp. la composée de fE) par la projection canonique de E sur PIEi/U.
    Une structure construite de cette façon s'appelle un ultraproduit des E (sous-entendu relativement à l'ultrafiltre U).
    Enfin si tous les Ei sont égaux à une même structure A, l'ultraproduit est appelé une ultrapuissance de A (par U) et on le note AI/U.

  2. Exemples, véracité presque partout
    Les ultraproduits sont une construction purement algébrique, mais il serait vain d'ignorer leurs jolies propriétés logiques :
    Lemme (de Los)
    Soient L un langage du premier ordre, "F" une formule de L, et (Ei)I une famille de L-structure indexée sur un ensemble I, et U un ultrafiltre sur I. Les assertions suivantes sont équivalentes :
    (i)
    "F" est satisfaite U-presque partout par (Ei)I.
    (ii)
    PIEi/U satisfait "F".
    Remarquons que l'on sait déjà, par définition de l'égalité U-presque partout, que le lemme est vrai pour une formule du type "a = b". La démonstration du lemme de Los part de cette constatation et la généralise aux formules quelconques, par une récurrence triviale sur la construction des formules (en fait les ultraproduits sont construits exactement pour que le lemme de Los marche).

    Exemples : Fixons un ensemble I.

    Ces observations combinées au lemme de Los nous conduisent au resultat suivant :

    Corollaire
    Soient L un langage du premier ordre, "F" une formule de L, et (Ei)I une famille de L-structure indexée sur un ensemble I. Les assertions suivantes sont équivalentes :
    (i)   
    "F" est satisfaite dans Ei, pour presque tout i (i.e. tout i dans I sauf un nombre fini).
    (ii)   
    PIEi/U satisfait "F" pour tout ultrafiltre non trivial U sur I.

    Preuve : Soit J l'ensemble des éléments de I pour lesquels Ei satisfait "non(F)". Les exemples discutés ci-dessus montrent que J est infini si seulement s'il existe un ultrafiltre non trivial contenant J, i.e. d'après le lemme de Los si seulement s'il existe un ultraproduit non trivial des Ei qui satisfasse "non(F)". Autrement dit (i) est faux si et seulement si (ii) est faux, ce qui prouve le corollaire.

    C'est l'un des principaux interêts des ultraproduits qui apparaît dans ce corollaire : pour démontrer qu'une propriété est vraie, par exemple, dans tout corps fini sauf un nombre fini, il suffit de montrer quelle est vraie (uniformément) dans tout ultraproduit non trivial des corps finis. Les ultraproduits sont donc des structures adaptées à la démonstration de vérités « asymptotiques ».

  3. Au-delà des corps valués complets
    Rappelons qu'un anneau de valuation est un anneau R unitaire, commutatif, intègre, tel que pour tout x dans le corps des fractions de R, x ou son inverse soit élément de R. Un tel anneau définit une topologie sur son corps des fractions, obtenue en prenant comme base de voisinage de 0 l'ensemble des idéaux non nuls de R. Cette topologie est triviale (i.e. discrète) si et seulement si R est un corps, auquel cas on dit que c'est un anneau de valuation trivial. Si R est noethérien, il est appelé anneau de valuation discrète. Le complété d'un corps relativement à la topologie induite par un anneau de valuation discrète s'appelle un corps local.

    Exemples

    Les corps locaux sont des objets centraux de l'algèbre contemporaine, spécialement pour l'étude des équations polynomiales. Nous ne pouvons prétendre qu'une personne totalement étrangère à ces notions pourra en saisir ici l'essentiel. Il faut notamment admettre que l'on sait très bien classer les corps locaux à isomorphisme près.
    Nous appellerons corps pseudo-locaux les corps qu'on peut obtenir comme ultraproduits de corps locaux (cette notion n'est pas standard, mais interne à ce document). Cette classe contient strictement celle des corps locaux. Un corps pseudo-local est canoniquement muni d'un anneau de valuation non trivial, en général non noethérien, induisant une topologie pour laquelle le corps considéré n'est en général pas complet. Il possède néanmoins des propriétés remarquables, comme d'être hensélien, pseudo-complet et d'admettre une section pour sa valuation. Nous épargnerons au lecteur déjà bien éprouvé les définitions de ces termes ; qu'il nous soit permis d'affirmer sans plus de détails que l'on sait prolonger à la classe des corps pseudo-locaux de cardinal Aleph(1) la classification à isomorphisme près des corps locaux, modulo l'hypothèse du continu.
    Aleph(1) est le plus petit cardinal non dénombrable. il est donc inférieur ou égal au cardinal de R, qui est aussi celui des corps Qp et Fp[[T]]. L'hypothèse du continu affirme que R (et donc aussi ces autres corps) est de cardinal exactement Aleph(1).

    Cette classification des corps pseudo-locaux permet d'énoncer le théorème suivant :

    Théorème d'Ax-Kochen (modulo l'hypothèse du continu).
    Soit U un ultrafiltre non trivial sur l'ensemble I des nombres premiers, alors :

    PIQp/U   est isomorphe à   PIFp[[T]]/U.

    En outre, on peut s'arranger pour que cet isomorphisme envoie l'anneau de valuation de PIQp/U sur celui de PIFp[[T]]/U.

    Note : L'énoncé ci-dessus est en fait une conséquence d'un théorème d'Ax-Kochen qui classifie à isomorphisme près des corps plus généraux que ceux que nous avons appelés pseudo-locaux. Nous engageons le lecteur intéressé à consulter l'excellent article récapitulatif The model theory of fields, Simon Kochen, LNM 499, pp. 384-426.

  4. Le principe de transfert d'Ax-Kochen, et applications
    Les arithméticiens, qui manipulent fréquemment les corps locaux, ont observé de frappantes similitudes entre Qp et Fp[[T]] (où Fp désigne le corps à p éléments) sans pouvoir formuler précisément la nature de cette analogie. Cela a donné naissance à nombre de conjectures du type : « tel résultat a été démontré dans Fp[[T]], on conjecture qu'il est vrai aussi dans Qp (ou l'inverse) ». La conjecture d'Artin dont nous allons parler appartient à cette famille.
    Le théorème d'Ax-Kochen permet de donner à cette analogie un sens tout-à-fait précis :

    Le principe de transfert
    Soit "F" une formule du langage des anneaux. Alors les assertions suivantes sont équivalentes :
    (i)   
    Fp[[T]] satisfait "F" pour presque tout nombre premier p.
    (ii)   
    Qp satisfait "F" pour presque tout nombre premier p.

    Preuve : (i) est faux si et seulement s'il existe un ultrafiltre non trivial U sur l'ensemble I des nombres premiers tel que PIFp[[T]]/U. satisfasse "F". Ceci est équivalent à ce qu'il existe un ultrafiltre non trivial U' sur I tel que PIQp/U' satisfasse "F" (il suffit de prendre U = U' puisque les deux ultraproduits sont isomorphes d'après le théorème d'Ax-Kochen). Ce dernier point équivaut à dire que (ii) est faux, ce qui achève de démontrer le principe de transfert.

    Ce théorème profond élucide totalement la nature de l'analogie entre les Fp[[T]] et les Qp. Il trivialise ainsi plusieurs conjectures ou résultats difficiles d'arithmétique. Nous en donnons maintenant deux exemples.

    Application 1
    Un corps k est dit C(i,d) si tout polynôme homogène de degré d en di+1 indeterminées possède un zéro non trivial dans k (i.e. à coordonnées dans k et non toutes nulles). Un théorème bien connu de Chevalley montre par exemple que Fp est C(1,d) pour tout entier d. Un théorème de Lang affirme également que Fp[[T]] est C(2,d) pour tout entier d.

    Conjecture d'Artin
    Qp est C(2,d) pour tout entier d.

    Il a été prouvé que Qp était C(2,2) et C(2,3). Mais il s'est avéré que la conjecture était fausse : Q2 n'est pas C(2,4) ! Néanmoins, le théorème d'Ax-Kochen montre qu'elle est asymptotiquement vraie :

    Théorème
    Soit d un entier fixé. Alors Qp est C(2,d) pour presque tout p.

    Preuve : C'est une application directe du principe de transfert : une fois fixé un entier d, il est facile de voir que la propriété « être C(2,d) » se dit par une formule "Fd" du langage des anneaux (il suffit de quantifier sur les coefficients des formes de degré d en di+1 variables). Puisque Fp[[T]] est C(2,d) pour presque tout p, et même pour tout p d'après le théorème de Lang, le principe de transfert nous donne immédiatement que Qp satisfait "Fd" pour presque tout p, i.e. que Qp est C(2,d) pour presque tout p.

    Signalons qu'il n'existe pas à ce jour (à notre connaissance) de démonstration purement algébrique de la version asymptotique de la conjecture d'Artin.

    Application 2
    L'autre application que nous citons maintenant résoud une conjecture de Lang (pour laquelle il existe aussi un démonstration algébrique, mais difficile) :

    Théorème
    Soit d un entier, et f un polynôme homogène de degré d, à coefficients entiers, en d+1 indéterminées.
    Alors f possède un zéro non trivial dans
    Qp pour presque tout p.

    Preuve : On considère la formule suivante, du langage des anneaux (si un entier n est coefficient de f, on le remplace par le terme "1+1+..+1" (n fois) où "1" est le symbole de constante du langage des anneaux qu'on interprete comme l'élément unité dans Qp ou dans Fp[[T]]) :

    Form :    E x1,..,E xd,   f(x1,..,xd)=0  et  [non(x1=0) ou ... ou non(xd=0)]

    f a un zéro non trivial dans tout Fp, d'après le théorème de Chevalley (Fp est C(1,d)). Il a donc a fortiori un zéro non trivial dans Fp[[T]] pour tout p, i.e. Fp[[T]] satisfait "Form" pour tout p. Par le principe de transfert il s'ensuit que Qp la satisfait pour presque tout p, et donc que f possède un zéro non trivial dans Qp pour presque tout p.


Conclusion

La théorie des modèles est vaste, et on pourrait continuer à donner bien d'autres éléments de réponses à la question que pose le titre de cette page. C'est aussi une branche bien vivante des mathématiques, en pleine évolution, ce qui rend vaine toute tentative d'épuiser ainsi le sujet. J'espère seulement que la lecture de cette page vous en aura donné un petit aperçu.

Il n'est pas inutile de préciser que les applications de la théorie des modèles à l'algèbre ou à d'autres branches des mathématiques ne constituent pas l'essence de la discipline, laquelle serait plutôt à chercher du côté de la théorie de la stabilité. Il arrive pourtant que les deux se rejoignent : en 1995, Hrushowski, en démontrant un théorème de pure théorie de la stabilité a mis en effervescence le petit monde des logiciens (cf. séminaires Bourbaki, Février 96, exposé 811). Il venait de résoudre une difficile conjecture de Mordell-Lang sur les corps de fonctions, par une preuve dont le noyau fonctionnait aussi bien en caractéristique nulle (où les géomètres en connaissaient déjà une) qu'en caractéristique positive (où la preuve de Hrushowski est à ce jour la seule connue).


Vous êtes intéressé ? Écrivez-moi !



Dernière mise à jour importante : 31 août 1999