![]() |
Qu'est-ce que la théorie des modèles ? |
La théorie des modèles est une branche de la
logique mathématique. Le but de cette page est d'aller un peu
au-delà de cette première définition sommaire.
L'entreprise étant de vulgarisation, je n'ai pas cherché
à être exhaustif ni élitiste, mais j'ai essayé
quand c'était possible d'inclure quelques preuves choisies
parmi les plus élémentaires, afin d'illustrer un peu
mon propos.
La plupart des livres d'introductions à la théorie des
modèles rebutent le lecteur par d'interminables (mais
indispensables) bavardages sur le formalisme de la logique du 1er
ordre (la seule dont il sera question ici). La plupart aussi incluent
des gloses nombreuses (et beaucoup moins indispensables) sur le
passé de la théorie, dont le glorieux
théorème de Gödel. Mon but ici n'est pas
de démontrer rigoureusement quoi que ce soit, ni de
démonter les fins rouages des fondements des
mathématiques, mais au contraire d'utiliser la
compréhension intuitive de ce formalisme (quantificateurs...etc.)
que tout mathématicien contemporain a acquis à
l'usage, pour donner un aperçu heuristique de
quelques questions et résultats modernes de
cette branche un peu exotique des mathématiques.
Le lecteur est donc prévenu : il n'y aura dans cet
exposé à peu près aucun formalisme.
Faute de formalisme, il n'y aura non plus aucune précision,
et sans précision il n'y a pas de rigueur possible.
À bon entendeur...!
« Les mathématiciens n'ont pas le privilège de la rigueur, ils ont seulement celui de la précision. » |
Citation approximative de HEIDEGGER |
« Seuls les métaphysiciens sont capables de rigueur dans le vague, laissez-leur ce privilège. » |
MOI (à mes élèves, en TD) |
Prérequis :
Sommaire :
PrésentationL'Histoire ancienneAutour du théorème de compacité
Définitions
Exemples
Mais, mais, mais...!?Quand une théorie a-t-elle des modèles ?Un pas vers la stabilité
Y a-t-il des corps vraiment très grands ?
Conclusion sur le théorème de compacitéExemple des Q-espaces vectorielsDe la théorie des modèles à l'algèbre
Exemple des corps algébriquement clos
Le théorème de Morley
Ultraproduits, ultrapuissancesConclusion
Exemples, véracité presque partout
Au-delà des corps valués complets
Le principe de transfert d'Ax-Kochen, et applications
![]() |
Présentation |
Cette étude du formalisme des démonstrations a été initiée par les grecs (qui ont aussi inventé le raisonnement axiomatique). Mais elle est restée à l'état embryonnaire pendant des siècles : la classification des 256 syllogismes d'Aristote est longtemps passée pour ce qu'on pouvait faire de mieux dans le genre (Kant dit quelque part que la logique est une science parfaite, mais parfaitement achevée depuis son origine).
Ce n'est que dans la deuxième moitié du XIXe siècle que les travaux de Cantor, Frege, Peano, Hilbert, Zermelo, Russell, Fraenkel (par ordre chronologique, et j'en oublie surement) sur les fondements des mathématiques et/ou sur la théorie des ensembles ont permis d'opérer une vaste réorganisation de cette discipline. Grâce à leurs efforts, le formalisme mathématique atteignit un niveau suffisant pour qu'on puisse commencer à raisonner dessus sans se prendre les pieds dans le tapis ! La logique mathématique a alors pris son essor et s'est définitivement séparée de la philosophie.
Le théorème d'incomplétude de Gödel (1931) peut être considéré comme l'acte de naissance de cette nouvelle discipline. Bien entendu ce choix contient une part d'arbitraire, mais l'extraordinaire retentissement de ce théorème, même au-delà des mathématiques, en fait un repère naturel. Depuis, la logique formelle s'est développée dans plusieurs directions, que l'on peut ranger sommairement en une partie « informatique fondamentale » et une partie « mathématiques pures ». La première connait depuis quelques temps un engouement indéniable, on y range diverses sous-disciplines telles que le lambda-calcul, la théorie de la démonstration...etc. Le regrettable cloisonnement des sciences modernes étant ce qu'il est, je dois avouer que je ne connais pas grand chose à ces domaines pourtant voisins du mien (soupir...). La partie « mathématiques pures » de la logique est celle dont je veux parler maintenant.
Quand la fonction fE est surjective ?
Bravo, vous avez tout compris !
On dit qu'une structure E est modèle d'une
théorie T, ou qu'elle satisfait T
si toute formule de T est satisfaite dans E
(au sens de l'exemple ci-dessus).
Note :
![]() |
Quand je parle de « la »
théorie des ensembles, je veux parler des axiomes
de Zermelo-Fraenkel ![]() ![]() |
![]() |
Autour du théorème de compacité |
Théorème (de complétude).Il est hors de question de donner ici la preuve de ce théorème, que le lecteur interessé trouvera dans tout manuel de théorie des modèles. Non qu'elle soit abominable (c'est une des premières qu'on voit en DEA) mais elle exigerait de détailler pas mal de choses dont je n'ai pas envie de parler ici... après tout cette page n'est qu'une présentation sommaire !
Une théorie T a un modèle si et seulement si "FAUX" n'est pas conséquence de T.
Une théorie est dite consistante si on ne peut en déduire
"FAUX", et contradictoire sinon. Elle est dite
satisfaisable si elle a un modèle. En vertu de ce qui
précède les deux notions (consistance ou satisfaisabilité)
coïncident.
Ce ne serait pas vrai avec d'autres logiques que celle du premier ordre !!
L'application suivante du théorème de complétude
est sans nulle doute la plus utilisée de la théorie
des modèles.
Théorème (de compacité).Preuve : Une implication est triviale : si T a un modèle celui-ci satisfait toutes les formules de T, et donc est aussi modèle de tout sous-ensemble fini de formules de T.
Une théorie T est satisfaisable si et seulement si elle est finiment satisfaisable (ie. si toute partie finie de T a un modèle).
Le théorème de compacité est un moyen puissant de construire des modèles d'une théorie. Nous allons en donner tout de suite une application.
Théorème (de Löwenheim-Skolem montant).Preuve : Soit T une telle théorie dans un langage L, et soit X un ensemble de nouveaux symboles de constantes, de cardinal Kappa. Dans le langage L' formé par la réunion de L et de X, on considère la théorie T' obtenue en rajoutant à T les formules "non(c=d)" pour toute paire de symboles distincts {c,d} appartenant à X. Un modèle de T' n'est rien d'autre qu'un modèle de T dans lequel on a choisi Kappa éléments distincts pour interpréter les Kappa symboles de X. Il est clair que la L-structure sous-jacente à un tel modèle est un modèle de T de cardinal supérieur ou égale à Kappa. Il suffit donc, pour prouver le théorème, de montrer que T' est satisfaisable.
Soit Kappa un cardinal arbitrairement choisi.
Si une théorie possède un modèle infini, alors elle possède un modèle de cardinal superieur ou égal à Kappa.
Remarque : Notons que la preuve montre en fait un peu plus, à savoir que pour qu'une théorie ait des modèles infinis de cardinal arbitrairement grand il suffit que pour tout entier n elle ait un modèle ayant au moins n éléments distincts.
Corollaire.Preuve : Si l'une ou l'autre de ces classes était axiomatisable, elle contiendrait des modèles infinis de cardinal arbitrairement grand d'après le théorème de Löwenheim-Skolem montant (et la remarque ci-dessus), alors qu'elle n'est par définition constituée que de corps de cardinal au plus égal à celui de C.
La classe des corps finis, comme celle des sous-corps de C, n'est pas axiomatisable.
Note : Le « vrai » théorème de Löwenheim-Skolem est le théorème de Löwenheim-Skolem descendant, dont la preuve est beaucoup plus subtile. Celui-ci, combiné avec la version « montante » ci-dessus nous donne le théorème de Löwenheim-Skolem :
Théorème (de Löwenheim-Skolem).Ce théorème montre que si on fixe une théorie T dans un langage fini ou dénombrable et qu'on se demande :
Soit T une théorie dans un langage L, et Kappa un cardinal arbitrairement choisi, supèrieur ou égal à celui L.
Si T admet un modèle infini, alors T admet (au moins) un modèle de cardinal Kappa.
La technique employée dans le corollaire ci-dessus
permet très généralement
de montrer que toute propriété de caractère
finitaire (par exemple être un anneau de type fini,
de présentation finie, noethérien, artinien...etc)
n'est pas axiomatisable. Du point de vue de l'algèbre classique
on perd donc beaucoup en se restreignant aux classes de structures
axiomatisables. Mais on acquière la possibilité
de construire facilement des modèles.
Il n'est pas clair qu'on gagne au change
mais il arrive que ces méthodes de constructions permettent
de déplacer un problème d'une structure classique
(comme un sous-corps de C) dans une structure plus grande
(trop grande pour l'algèbre ordinaire)
où il est facile à résoudre, un peu comme il est
parfois nécessaire de passer dans C pour résoudre
un problème dans R. Nous verrons quelques exemples
où ce passage est à ce jour la seule solution connue
pour des problèmes qui ne sont même pas
de théorie des modèles.
Mais avant cela, nous allons nous pencher sur la question la plus naïve qui soit, après celles que nous venons de poser : combien une théorie a-t-elle de modèles ? Plus exactement, nous allons nous demander combien elle a de modèles infinis. Nous venons de voir que si elle en a, elle en a au moins un en tout cardinal infini (on suppose le langage de cette théorie dénombrable). Mais en un cardinal donné combien peut-elle en avoir ?
![]() |
Un pas vers la stabilité |
La théorie de la stabilité est le « must » de la théorie des modèles d'aujourd'hui. Elle a été inventée par Shelah et revisitée par Hrushovsky (Shelah est considéré comme le Grothendieck de la théorie des modèles, et Hrushovsky est un peu son Deligne... :-)). Les outils qu'elle utilise (inventés par Shelah) sont très généraux, très puissants, pas si abstraits que ça (comparés aux shémas ou à la cohomologie, par exemple) mais il ne nous est pas possible de les présenter assez simplement ici (du moins pour l'instant, mais j'y reviendrai un jour, j'espère). Disons que l'idée de base est de regarder, non plus globalement l'ensemble des formules satisfaites par une structure (ce qu'on appelle sa théorie) mais localement celles satisfaites par un n-uplet donné dans une structure (ce qu'on appelle son type).Sans entrer dans ces considérations trop sophistiquées pour l'instant, nous allons présenter un résultat assez typique, dont l'énoncé a le mérite de ne pas utiliser les types (sa démonstration, si !). On commence par deux exemples.
A x, A y, x+y=y+x
A x, E y, x=y+y+...+y (n fois y)
A x, non(x=0) --> non(x+x+...+x=0) (n fois x)
Il s'ensuit que deux Q-espaces vectoriels quelconques de cardinal non dénombrable sont isomorphes si et seulement si ils ont même cardinal (on construit un isomorphisme en envoyant bijectivement une base sur une base).
A a0,...,A ad-1, E x, xd + ad-1xd-1 + ... + a0 = 0
Deux corps algébriquement clos de même caractéristique et de même cardinal non dénombrable sont isomorphes.
Théorème (de Morley).L'idée de la preuve (qui n'est pas du tout facile) est de définir sur deux n-uplets d'un modèle donné une notion d'indépendance, puis de base comme famille indépendante maximale, simplement à partir des formules (c'est là que les types interviennent). Il se trouve que pour une théorie catégorique en un cardinal non dénombrable, cette notion définie abstraitement se comporte bien : toutes les bases d'un modèle ont même cardinal, et tout modèle de cardinal Kappa non dénombrable possede une base de cardinal Kappa. Il est alors possible de définir un isomorphisme entre deux tels modèles de même cardinal à partir d'une bijection quelconque entre leurs bases, exactement comme dans les exemples.
Si une théorie dans un langage fini ou dénombrable est catégorique en un cardinal non dénombrable alors elle l'est en tout cardinal non dénombrable.
La difficulté de la preuve est de construire une notion de famille libre indépendamment de la nature exacte des structures et des langages considérés. Trouver, en quelque sorte un noyau commun à la notion d'indépendance linéaire et à celle d'indépendance algébrique ; en effet dans le cas particulier de la théorie des Q-espaces vectoriels ou de celle des corps algébriquement clos, la notion abstraite d'indépendance introduite dans la preuve du théorème se réduit bien à celles que nous connaissons. Ainsi ces deux exemples sont-ils des cas particuliers du théorème de Morley.
![]() |
De la théorie des modèles à l'algèbre |
Lemme (de Los)Remarquons que l'on sait déjà, par définition de l'égalité U-presque partout, que le lemme est vrai pour une formule du type "a = b". La démonstration du lemme de Los part de cette constatation et la généralise aux formules quelconques, par une récurrence triviale sur la construction des formules (en fait les ultraproduits sont construits exactement pour que le lemme de Los marche).
Soient L un langage du premier ordre, "F" une formule de L, et (Ei)I une famille de L-structure indexée sur un ensemble I, et U un ultrafiltre sur I. Les assertions suivantes sont équivalentes :
(i) "F" est satisfaite U-presque partout par (Ei)I.
(ii) PIEi/U satisfait "F".
Exemples : Fixons un ensemble I.
Ces observations combinées au lemme de Los nous conduisent au resultat suivant :
Corollaire
Soient L un langage du premier ordre, "F" une formule de L, et (Ei)I une famille de L-structure indexée sur un ensemble I. Les assertions suivantes sont équivalentes :
(i) "F" est satisfaite dans Ei, pour presque tout i (i.e. tout i dans I sauf un nombre fini).
(ii) PIEi/U satisfait "F" pour tout ultrafiltre non trivial U sur I.
Preuve : Soit J l'ensemble des éléments de I pour lesquels Ei satisfait "non(F)". Les exemples discutés ci-dessus montrent que J est infini si seulement s'il existe un ultrafiltre non trivial contenant J, i.e. d'après le lemme de Los si seulement s'il existe un ultraproduit non trivial des Ei qui satisfasse "non(F)". Autrement dit (i) est faux si et seulement si (ii) est faux, ce qui prouve le corollaire.
C'est l'un des principaux interêts des ultraproduits qui apparaît dans ce corollaire : pour démontrer qu'une propriété est vraie, par exemple, dans tout corps fini sauf un nombre fini, il suffit de montrer quelle est vraie (uniformément) dans tout ultraproduit non trivial des corps finis. Les ultraproduits sont donc des structures adaptées à la démonstration de vérités « asymptotiques ».
Exemples
Les corps locaux sont des objets centraux de l'algèbre contemporaine,
spécialement pour l'étude des équations polynomiales.
Nous ne pouvons prétendre qu'une personne totalement
étrangère à ces notions pourra en saisir ici
l'essentiel. Il faut notamment admettre que l'on sait très bien
classer les corps locaux à isomorphisme près.
Nous appellerons corps pseudo-locaux les corps qu'on peut obtenir
comme ultraproduits de corps locaux (cette notion n'est pas standard,
mais interne à ce document). Cette classe contient strictement
celle des corps locaux. Un corps pseudo-local est canoniquement muni d'un
anneau de valuation non trivial, en général non
noethérien, induisant une topologie pour laquelle le corps
considéré n'est en général pas complet.
Il possède néanmoins des propriétés
remarquables, comme d'être hensélien, pseudo-complet
et d'admettre une section pour sa valuation. Nous épargnerons au lecteur
déjà bien éprouvé les définitions de
ces termes ; qu'il nous soit permis d'affirmer sans plus de
détails que l'on sait prolonger à la classe des corps pseudo-locaux
de cardinal Aleph(1) la classification à isomorphisme
près des corps locaux, modulo l'hypothèse du continu.
![]() |
Aleph(1) est le plus petit cardinal non dénombrable. il est donc inférieur ou égal au cardinal de R, qui est aussi celui des corps Qp et Fp[[T]]. L'hypothèse du continu affirme que R (et donc aussi ces autres corps) est de cardinal exactement Aleph(1). |
Cette classification des corps pseudo-locaux permet d'énoncer le théorème suivant :
Théorème d'Ax-Kochen (modulo l'hypothèse du continu).
Soit U un ultrafiltre non trivial sur l'ensemble I des nombres premiers, alors :
PIQp/U est isomorphe à PIFp[[T]]/U.
En outre, on peut s'arranger pour que cet isomorphisme envoie l'anneau de valuation de PIQp/U sur celui de PIFp[[T]]/U.
Note : L'énoncé ci-dessus est en fait une conséquence d'un théorème d'Ax-Kochen qui classifie à isomorphisme près des corps plus généraux que ceux que nous avons appelés pseudo-locaux. Nous engageons le lecteur intéressé à consulter l'excellent article récapitulatif The model theory of fields, Simon Kochen, LNM 499, pp. 384-426.
Le principe de transfert
Soit "F" une formule du langage des anneaux. Alors les assertions suivantes sont équivalentes :
(i) Fp[[T]] satisfait "F" pour presque tout nombre premier p.
(ii) Qp satisfait "F" pour presque tout nombre premier p.
Preuve : (i) est faux si et seulement s'il existe un ultrafiltre non trivial U sur l'ensemble I des nombres premiers tel que PIFp[[T]]/U. satisfasse "F". Ceci est équivalent à ce qu'il existe un ultrafiltre non trivial U' sur I tel que PIQp/U' satisfasse "F" (il suffit de prendre U = U' puisque les deux ultraproduits sont isomorphes d'après le théorème d'Ax-Kochen). Ce dernier point équivaut à dire que (ii) est faux, ce qui achève de démontrer le principe de transfert.
Ce théorème profond élucide totalement la nature de l'analogie entre les Fp[[T]] et les Qp. Il trivialise ainsi plusieurs conjectures ou résultats difficiles d'arithmétique. Nous en donnons maintenant deux exemples.
Application 1
Un corps k est dit C(i,d) si tout polynôme
homogène de degré d en di+1
indeterminées possède un zéro non trivial dans k
(i.e. à coordonnées dans k et non toutes nulles).
Un théorème bien connu de Chevalley montre par exemple que
Fp est C(1,d) pour tout entier d.
Un théorème de Lang affirme également
que Fp[[T]] est C(2,d) pour tout
entier d.
Conjecture d'Artin
Qp est C(2,d) pour tout entier d.
Il a été prouvé que Qp était C(2,2) et C(2,3). Mais il s'est avéré que la conjecture était fausse : Q2 n'est pas C(2,4) ! Néanmoins, le théorème d'Ax-Kochen montre qu'elle est asymptotiquement vraie :
Théorème
Soit d un entier fixé. Alors Qp est C(2,d) pour presque tout p.
Preuve : C'est une application directe du principe de transfert : une fois fixé un entier d, il est facile de voir que la propriété « être C(2,d) » se dit par une formule "Fd" du langage des anneaux (il suffit de quantifier sur les coefficients des formes de degré d en di+1 variables). Puisque Fp[[T]] est C(2,d) pour presque tout p, et même pour tout p d'après le théorème de Lang, le principe de transfert nous donne immédiatement que Qp satisfait "Fd" pour presque tout p, i.e. que Qp est C(2,d) pour presque tout p.
Signalons qu'il n'existe pas à ce jour (à notre connaissance) de démonstration purement algébrique de la version asymptotique de la conjecture d'Artin.
Application 2
L'autre application que nous citons maintenant résoud une
conjecture de Lang (pour laquelle il existe aussi un démonstration
algébrique, mais difficile) :
Théorème
Soit d un entier, et f un polynôme homogène de degré d, à coefficients entiers, en d+1 indéterminées.
Alors f possède un zéro non trivial dans Qp pour presque tout p.
Preuve : On considère la formule suivante, du langage des anneaux (si un entier n est coefficient de f, on le remplace par le terme "1+1+..+1" (n fois) où "1" est le symbole de constante du langage des anneaux qu'on interprete comme l'élément unité dans Qp ou dans Fp[[T]]) :
f a un zéro non trivial dans tout Fp, d'après le théorème de Chevalley (Fp est C(1,d)). Il a donc a fortiori un zéro non trivial dans Fp[[T]] pour tout p, i.e. Fp[[T]] satisfait "Form" pour tout p. Par le principe de transfert il s'ensuit que Qp la satisfait pour presque tout p, et donc que f possède un zéro non trivial dans Qp pour presque tout p.
![]() |
Conclusion |
La théorie des modèles est vaste, et on pourrait continuer à donner bien d'autres éléments de réponses à la question que pose le titre de cette page. C'est aussi une branche bien vivante des mathématiques, en pleine évolution, ce qui rend vaine toute tentative d'épuiser ainsi le sujet. J'espère seulement que la lecture de cette page vous en aura donné un petit aperçu.Il n'est pas inutile de préciser que les applications de la théorie des modèles à l'algèbre ou à d'autres branches des mathématiques ne constituent pas l'essence de la discipline, laquelle serait plutôt à chercher du côté de la théorie de la stabilité. Il arrive pourtant que les deux se rejoignent : en 1995, Hrushowski, en démontrant un théorème de pure théorie de la stabilité a mis en effervescence le petit monde des logiciens (cf. séminaires Bourbaki, Février 96, exposé 811). Il venait de résoudre une difficile conjecture de Mordell-Lang sur les corps de fonctions, par une preuve dont le noyau fonctionnait aussi bien en caractéristique nulle (où les géomètres en connaissaient déjà une) qu'en caractéristique positive (où la preuve de Hrushowski est à ce jour la seule connue).