• LAREMA UMR 6093 CNRS
  • SFR Math-STIC
  • Faculté des sciences
  • Université d’Angers

Mathématiques à Angers

  • Accueil
    • Contacts
    • Nous visiter
    • Bibliothèque de Mathématiques
  • Annuaire
  • Les formations
    • Licence de Mathématiques
    • Double licence Mathématiques-Économie
    • Double licence Mathématiques-Informatique
    • Licence de mathématiques à distance
    • Master Mathématiques Fondamentales et Applications
    • Master MEEF Mathématiques
    • Master Data Science
    • Parcours d’étudiants
  • Recherche
    • Équipe Algèbre et Géométries
    • Équipe Analyse, Probabilités et Statistique
    • Publications du LAREMA
    • Séminaires du LAREMA
    • Invités du LAREMA
    • Annales Henri Lebesgue
  • Liens internes
    • Intranet
    • plmbox du LAREMA
    • Gestion des séminaires
  • Grand public
    • Années des mathématiques
    • Pourquoi faire des maths ?
    • Math en Jeans
    • Fête de la science
    • Les cinq minutes Lebesgue
    • Images des mathématiques
    • Maison mathématique de l’Ouest
    • Agence Lebesgue
    • Math in France
You are here: Home / Séminaires du LAREMA / Séminaire de probabilités et statistique

Séminaire de probabilités et statistique

Responsable : Mikael Escobar-Bach

Séminaires à venir

Séminaires passés

Nous présentons des résultats en grande dimension sur la norme Hilbert-Schmidt d’une matrice uniformément distribuée dans la boule unité au sens de la p-norme des valeurs singulières. Nous nous appuyons sur la connexion avec l’analyse spectrale des beta-ensembles en adaptant notamment certains résultats de fluctuation dus à Bekerman, Leblé et Serfaty. Lorsque p>3, cela nous permet d’établir une version forte de la conjecture de la variance restreinte aux p-boules de Schatten auto-adjointes. Travail en commun avec Matthieu Fradelizi, Olivier Guédon et Pierre-André Zitt.

Dans cet exposé seront présentés des résultats de percolation orientée sur triangulations causales aléatoires, un modèle de cartes aléatoires dont l’étude mathématique est encore récente. Pour résumer simplement, les triangulations causales sont des graphes planaires construits en ajoutant des arêtes « horizontales » entre les sommets situés à même hauteur dans un arbre de taille infinie, de façon à constituer des cycles. Quand l’arbre sous-jacent est un arbre de Galton-Watson surcritique, conditionné à survivre, avec une loi de reproduction géométrique de moyenne m>1, le processus de percolation orientée connaît une transition de phase en un seuil p_c(m), non trivial, dont une expression est connue. Au-dessus de ce seuil, il y a dans la carte, presque sûrement, un nombre infini de clusters infinis. Un résultat typique pour des graphes dont la géométrie est hyperbolique. Différents exposants critiques du modèle peuvent aussi être exhibés. Enfin, au seuil de criticalité, les grands clusters remis à l’échelle convergent pour la distance de Gromov-Hausdorff vers l’arbre brownien. Les démonstrations de ces résultats sont basées sur un processus d’épluchage markovien de la carte, une technique éprouvée dans l’étude de cartes aléatoires planaires.

Dans cet exposé, nous reprenons la structure particulière des exposant de Lévy-Fourier qui sont la caractéristique des lois infiniment divisibles. Après des réductions successives, nous nous ramenerons à des exposants de Lévy-Laplace dont nous étendrons le noyer dans leurs représentations intégrales. Cette extension permettra de donner des interpretations probabilistes à des fonctions spéciales reliées à la fonction zeta.

Since their introduction in the 50's, variance component mixed models have been widely used in many application fields and particularly in genetics. In this context, ReML estimation is by far the most popular procedure to infer the variance components of the model. Although many implementations of the ReML procedure are readily available, there is still need for computational improvements due to the ever-increasing size of the datasets to be handled, and to the complexity of the models to be adjusted. We aim to provide a competitor to the widely used Average Information algorithm and other algorithms used in plant genetics. We focus on the use of the Min-Max algorithm to handle the inference of the variance component mixed model parameters. In genome-wide association studies the covariance matrix used within mixed models is the relatedness matrix between individuals. This matrix is generally unknown and its inference has been studied since the 20’s. Relatedness was first inferred using pedigree. Nowadays, thanks to new genotyping technologies, the relatedness can be inferred from genetic markers. The classical method is based on the moment method. We want to account for experimental design within our model. To this aim we use a mixture model to estimate relatedness from biallelic markers. Under some crossing design conditions the identifiability of our model is guaranteed and it gives more realistic estimates.

La mesure de Plancherel sur les partitions d'entiers est un objet riche. Via l'algorithme de RSK elle nous permet d'étudier les statistiques de sous-suites monotones de permutations aléatoires, et via un modèle fermionique on peut calculer toutes ses fonctions de correlation exactement. Elle produit une forme limite déterministe pour les partitions de grande taille, ainsi que des fluctuations de bord asymptotiques caracteristiques de la classe d'universalité de KPZ. Je parlerai de deux généralisations de cette mesure. La première, introduite en collaboration avec Dan Betea et Jérémie Bouttier, correspond à un modèle naturel de fermions, et entame de nouvelles fluctuations de bord asymptotiques dites multicritiques. La deuxième, introduite en collaboration avec Guillaume Chapuy et Baptiste Louf, est reliée aux factorisations par transpositions sur un groupe symétrique et produit une nouvelle forme limite à deux échelles. Alors que les deux généralisations possèdent des structures intégrables, on peut appliquer des méthodes exactes seulement dans le premier cas. Je discuterai des questions ouvertes par rapport à la connexion entre hierarchies intégrables et modèles fermioniques.

Les méthodes d'Analyse de Sensibilité Globale des modèles numériques de simulation sont des outils précieux permettant de quantifier l'importance relative des variables d'entrée du modèle sur celle de sortie. Récemment, une nouvelle approche à l'interface entre statistiques, probabilités et analyse fonctionnelle a été proposée. Plus précisément, il s'agit d'estimer les indices de Sobol, des indices de sensibilité basés sur une certaine décomposition de la variance du code de calcul, à partir d'indices faisant intervenir ses dérivées, l'élément clé reliant ces deux quantités étant l'inégalité de Poincaré. Dans le cadre d'entrées unidimensionnelles indépendantes, O. Roustant et ses collaborateurs ont étudié ces questions pour certaines mesures de probabilité tronquées sur des intervalles. Dans cet exposé, nous étudierons le cas de la dimension supérieure et verrons le rôle déterminant joué par la géométrie des ensembles sur lesquels nous tronquons. Il s'agit d'un travail en commun avec M. Bonnefont (Bordeaux).

Ce travail se concentre sur des méthodes de pooling (ou groupement) pour l'estimation de paramètres extrêmes d'une loi à queue lourde. On construit et étudie une classe d'estimateurs de Hill groupés de l'indice de valeurs extrêmes, et une classe d'estimateurs de Weissman groupés calculés par moyenne géométrique. On montre la convergence de ces estimateurs lorsque les distributions au sein des échantillons peuvent présenter de l'hétérogénéité, et en présence de dépendance entre les échantillons. On obtient des estimateurs optimaux du point de vue de la variance ou de l'erreur quadratique. Dans le cas de l'inférence distribuée, on montre que les estimateurs optimaux du point de vue de la variance sont asymptotiquement équivalents aux estimateurs de Hill et Weissman basés sur la fusion des échantillons, et on montre que les estimateurs optimaux du point de vue de l'erreur quadratique sont plus performants lorsque le biais est grand. On considère diverses extensions, comme le cas où le nombre d'échantillons augmente, ou la présence de covariables et/ou de dépendance temporelle. Des simulations et deux applications sur données réelles illustrent le comportement des estimateurs en pratique. Travail en collaboration avec Abdelaati Daouia (Toulouse School of Economics) et Simone Padoan (Bocconi University).

Dans cette présentation, nous considérons les tests portmanteau, aussi appelés tests d'autocorrélation, pour tester l'adéquation de classes de modèles de séries temporelles dont les termes d'erreur sont non corrélés mais qui peuvent contenir des dépendances non linéaires. Plus précisement, en considérant (par exemple) la classe des modèles ARMA (AutoRegressive Moving-Average), ces modèles sont appelés des ARMA faibles. Par opposition, nous appelons ARMA forts les modèles utilisés habituellement dans la littérature dans lesquels le terme d'erreur est supposé être un bruit indépendant. Nous relâchons l'hypothèse standard d'indépendance dans ces classes de modèles pour étendre leur champ d'application, ceci leur permettra aussi de couvrir de larges classes de processus non linéaires. Ce qui, permettra de traiter des processus ayant des dynamiques non linéaires très générales. Nous établissons les distributions asymptotiques des autocovariances et autocorrelations résiduelles. Ensuite, nous déduisons le comportement asymptotique des statistiques de tests portmanteau de Ljung-Box (ou Box-Pierce) de ces classes de modèles faibles. Enfin, nous proposons également une méthode pour ajuster les valeurs critiques de ces tests. Nous construisons des intervalles de confiances valides en présence d'innovations dépendantes.

Nous présenterons la notion de noyau de Stein, qui permet de généraliser la formule d'intégration par partie pour la loi normale (qui possède un noyau de Stein constant, égal à sa covariance). Nous nous focaliserons dans un premier temps sur la dimension 1, où sous de bonnes conditions le noyau de Stein possède une formule explicite. Nous verrons que le noyau de Stein apparaît naturellement comme pondération d'une inégalité de type Poincaré et qu'il permet d'obtenir des inégalités de concentration précises, de type ratio de Mills. Dans une seconde partie, nous travaillerons en dimension supérieure, en étudiant comment la notion de noyau de Stein permet de décrire la performance de l'estimateur de shrinkage, sans l'hypothèse classique de données Gaussiennes. Cette présentation se base notamment sur des travaux en collaboration avec Max Fathi, Larry Goldstein, Gesine Reinert et Jon Wellner.

Bukh et Zhou ont conjecturé que pour deux permutations i.i.d de taille n, l’espérance de la longueur de la plus longue sous-suite commune est minorée par racine carrée de n. Ce problème peut se ramener à la compréhension de la plus longue sous-suite croissante de permutations aléatoires. On détaillera le cas où la loi est stable sous conjugaison qui peut être traité à l’aide de la compréhension de la structure en cycle de la composée de deux permutations indépendantes.

Je présenterai dans cet exposé des résultats nouveaux sur l'existence et l'unicité de solution pour des EDSRs réfléchies dans des domaines non convexes supposés "faiblement étoilés". Notons que le cas particulier des EDSRs de générateur nul, à savoir l'espérance conditionnelle pour la filtration brownienne, est déjà un cas d'étude intéressant et permet de définir une notion de moyenne contrainte à prendre ses valeurs dans un ensemble non convexe. En particulier, on établit des résultats d'existence et d'unicité dans un cadre markovien avec une condition terminale et un générateur réguliers, mais également dans un cadre général sous une hypothèse de petitesse sur les paramètres de l'EDSR. C'est un travail en commun avec Jean-François Chassagneux (Université de Paris) et Sergey Nadtochiy (Illinois Institute of Technology)

L'étude des propriétés asymptotiques des cartes planaires aléatoires est notamment motivée par leur interprétation dans des modèles de gravité quantique. Les deux notions naturelles de limite asymptotique pour ces objets sont la limite locale, et la limite d'échelle. Pour certains modèles de cartes planaires aléatoires, des limites locales peuvent être construites à partir de la décomposition en couches des cartes du modèle, qui fait apparaître une structure généalogique dans ces cartes. Dans cet exposé, après avoir introduit les notions nécessaires, je parlerai du cas des triangulations eulériennes, qui sont d'un intérêt particulier pour la physique théorique, et où la méthode de décomposition en couches permet aussi, de manière indirecte, d'établir une limite d'échelle continue.

We analyse the spectrum of the (scaled) adjacency matrix A of the Erdos-Rényi graph G(N,d/N) in the critical regime d=blog N with b constant. We establish a one-to-two correspondence between vertices of degree at least 2d and nontrivial eigenvalues outside the asymptotic 2,2]. This correspondence implies a transition at an explicit b. For d>blogN the spectrum is just the [2,2] and the eigenvectors are completely delocalized. For d

We study a general class of causal processes with exogenous covariates, including many classical processes such as the ARMA-GARCH, APARCH, ARMAX, GARCH-X and APARCH-X processes. The existence of a $\tau$-weakly dependent solution is studied. We provide conditions for the strong consistency and derive the asymptotic distribution of the quasi-maximum likelihood estimator (QMLE), both when the true parameter is an interior point of the parameters space and when it belongs to the boundary. Relying on the QMLE of the model, we propose a consistent model selection procedure for this class. Application to the daily concentrations of PM$_{10}$ is considered.

Dans le cadre des big-data, nous sommes très souvent amenés à traiter un ensemble volumineux des données. Dans la première partie, nous utilisons des algorithmes stochastiques, afin de construire des estimateurs récursifs. L'intérêt majeur de ces approches récursives est qu'elles permettent une mise à jour rapide des estimateurs lorsque les données sont observées de manière séquentielle sans être obligé de stoker en mémoire toutes les observations passées. Dans la deuxième partie, nous nous focalisons sur le problème de l'estimation récursive d'une fonction de régression sur des données fonctionnelles, nous présentons quelques résultats concernant le comportement asymptotique de l'estimateur non-paramétrique proposé, nous automatisons par la suite le paramètre de lissage et nous comparons la méthode proposée à des méthodes existantes en utilisant des données simulées et ensuite des données réelles. Dans la troisième partie, nous abordons le problème de la classification supervisée de courbes, nous soulignons le gain de l’utilisation des approches récursives en utilisant des données simulées et ensuite des données réelles. Dans la quatrième partie, nous considérons le problème de la classification non supervisée en utilisant un exemple d’application issu du domaine de la Psychologie plus précisément en électroencéphalographie (EEG) qui souligne l’intérêt pratique de la méthode.

Une factorisation du n-cycle est une façon d'écrire la permutation (1, 2, ..., n) comme un produit de transpositions. Il est connu que le nombre minimal de transpositions dans une factorisation est n-1. Plus généralement, une factorisation en n-1+2g transpositions est appelée factorisation de genre g. Bien qu'il existe des formules explicites pour compter ces factorisations, aucune preuve combinatoire n'est connue. J'exposerai une bijection entre les factorisations du n-cycle et un ensemble de graphes à n sommets, qui permet d'obtenir combinatoirement le terme dominant dans ces formules, puis un algorithme inspiré de cette bijection et générant une factorisation asymptotiquement uniforme de genre fixé. Je montrerai également comment cet algorithme permet de décrire la limite d'échelle d'une factorisation uniforme de genre donné. Travail en collaboration avec Valentin Féray et Baptiste Louf.

L’étude du nombre de séries de t “pile” obtenus lors d’une suite de lancers indépendants d’une pièce de monnaie comme celle du nombre d’apparitions d’un mot rare dans une séquence d’ADN nécessite de prendre en compte le phénomène d’agglutination que l’apparition des différents événements exhibe. La méthode de Chen-Stein s’avère un outil particulièrement efficace pour borner l’erreur d’approximation lorsque la loi du nombre d’agglomérats peut être approchée par une loi de Poisson (éventuellement composé). Dans un travail sur lequel est basé cet exposé, on propose de revisiter cette méthode en ramenant les deux problèmes évoqués à celui d’approximation poissonienne pour des fonctionnelles de processus binomiaux marqués (MBP), i.e. les analogues discrets de processus de Poisson composés. Sont développés dans ce cadre des outils d’analyse stochastique pour les MBP regroupés autour d’une “théorie L^1” basée sur l’analogue de la formule de Mecke et d’une “théorie L^2” supportée par l’existence d’une décomposition en chaos des fonctionnelles. De MBP et à partir de laquelle on peut définir des opérateur de Malliavin (gradient, divergence etc.). Sous ce nouveau formalisme, on obtient un critère général - pour la distance en variation totale- d’approximation poissonienne pour des fonctionnelles de MBP et qui s’exprime en termes d’opérateurs de Malliavin. Dans cet exposé, on donnera des éléments du calcul de Malliavin développé pour les MBP, avant d’énoncer le résultat général d’approximation et de l’illustrer par l’application aux deux situations évoquées plus haut.

A natural and well-known way to discover the topology of random structures (such as a random graph G), is to have them explored by random walks. The usual random walk jumps from a vertex of G to a neighboring vertex, providing information on the connected components of the graph G. The number of these connected components is the Betti number beta0. To gather further information on the higher Betti numbers that describe the topology of the graph, we can consider the simplicial complex C associated to the graph G: a k-simplex (edge for k=1, triangle for k=2, tetrahedron for k=3 etc.) belongs to C if all the lower (k-1)-simplices that constitute it also belong to the C. For example, a triangle belongs to C if its three edges are in the graph G. Several random walks have already been propose recently to explore these structures, mostly in Informatics Theory. We propose a new random walk, whose generator is related to a Laplacian of higher order of the graph, and to the Betti number betak. A rescaling of the walk for k=2 (cycle-valued random walk) is also detailed when the random walk visits a regular triangulation of the torus. We embed the space of chains into spaces of currents to establish the limiting theorem. An application to statistical topology is proposed. Joint work with T. Bonis, L. Decreusefond and Z. Zhang.

Dans cet exposé, nous allons nous intéresser à l'estimation des primes de réassurance en présence de covariables aléatoires. En utilisant des arguments de théorie des valeurs extrêmes, nous proposerons un estimateur de la prime de risque conditionnel à une valeur pour la covariable, et nous établirons ses propriétés asymptotiques. Le comportement à distance finie de l'estimateur sera illustré sur la base de simulations, et la méthodologie développée sera appliquée à un jeu de données réelles en assurance automobile.

La marche aléatoire de l’éléphant est un processus introduit au début des années 2000 en physique statistique. Il s'agit d'une marche aléatoire avec un paramètre de mémoire, a priori non-markovienne, et telle que la loi de chaque nouveau pas dépend de tous les pas précédents. On explicitera une approche martingale qui permet d’obtenir de nombreux résultats en dimension 1 ainsi qu'en dimension supérieure. On présentera ensuite une généralisation de la marche de l’éléphant avec un renforcement de la mémoire qu’on étudiera toujours à l’aide de martingales. Enfin on expliquera le lien entre un modèle généralisé d'urnes de Pólya et la marche de l’éléphant qui permet de retrouver certains des résultats présentés.

Motivated by a problem arising in the analysis of convex hulls of high-dimensional random walks, we introduce a new class of discrete probability distributions, which we call Lah distributions, and which involve Stirling numbers of both kinds. We provide a combinatorial interpretation of the Lah distributions in terms of random compositions and records and prove various limit theorems for them. This talk is based on a recent joint work with Zakhar Kabluchko (Münster, Germany).

Let $(p_k)_{k\in\mathbb{N}}$ be a discrete probability distribution. Consider a deterministic weighted branching process generated by $(p_k)_{k\in\mathbb{N}}$. A nested Karlin's occupancy scheme is the sequence of Karlin's balls-in-boxes schemes in which boxes of the $j$th level, $j=1,2,\ldots$ are identified with the $j$th generation individuals and the hitting probabilities of boxes are identified with the corresponding weights. The collection of balls is the same for all generations, and each ball starts at the root and moves along the tree of the deterministic weighted branching process according to the following rule: transition from a mother box to a daughter box occurs with probability given by the ratio of the daughter and mother weights. Denote by $\mathcal{K}_n(j)$ the number of occupied (ever hit) boxes in the $j$th level provided that there are $n$ balls. Assume that the counting function $x\mapsto \#\{k\in\mathbb{N}: p_k\geq 1/x\}$ belongs to the de Haan class $\Pi$. I shall discuss a functional limit theorem for the vector-valued process $(\mathcal{K}^{(1)}_{\lfloor e^{T+u}\rfloor},\ldots, \mathcal{K}^{(j)}_{\lfloor e^{T+u}\rfloor})_{u\in\mathbb{R}}$, for each $j\in\mathbb{N}$, properly normalized and centered, as $T\to\infty$. The limit is a vector-valued process whose components are independent stationary Gaussian processes. I shall provide an integral representation of the limit process. The talk is based on a joint work with Z. Kabluchko (Münster) and V. Kotelnikova (Kyiv).

Dans cette présentation nous traiterons de la question du clustering lorsque plusieurs variables latentes de classes sont considérées (clustering par partitions multiples). En effet, supposer que toute l'hétérogénéité des données peut être expliquée par une seule variable latente est une hypothèse très forte, et il peut être utile de considérer que plusieurs blocs (ou combinaisons linéaires) de variables peuvent fournir différentes partitions des individus. Cela peut révéler de nouvelles lignes d'analyse des données. Dans ce cadre, nous présentons deux approches. La première approche suppose l'existence de plusieurs groupes de variables, chacun conduisant à une partition particulière des individus [1]. Le modèle suppose l'indépendance entre les blocs de variables, et dans chaque bloc l'indépendance des variables conditionnellement à la classe. Nous proposons une recherche simultanée des blocs de variables et des partitions associées des individus en classes, ce qui permet d’explorer efficacement l’espace des modèles. La seconde approche suppose l'existence de plusieurs projections classifiantes dans les données [2]. Le modèle suppose que les données sont obtenues à partir de combinaisons linéaires de variables classifiantes et non classifiantes, où chaque variable classifiante est supposée suivre une distribution de mélange spécifique. Les paramètres des modèles sont estimés par un algorithme EM généralisé. Nous illustrerons le comportement de ces modèles sur données simulées et réelles, et nous discuterons les perspectives associées. [1] Marbac, M. and Vandewalle, V. (2019). A tractable multi-partitions clustering. In: Computational Statistics & Data Analysis 132, pp. 167–179. [2] Vandewalle, V. (2020). Multi-Partitions Subspace Clustering. In: Mathematics 8.4, p. 597.

The reverse characteristic polynomial of a matrix A is q(z)=det(I - z A). I will show that when A is a (non-Hermitian) n x n random matrix with iid Bernoulli(d/n) entries, with d fixed, then when n goes to infinity, the polynomial q converges towards a random infinite holomorphic function F, which is the exponential of a random series with Poisson coefficients. This entails a short proof of previous results on the asymptotics of the eigenvalues of A, a strategy inspired by a recent paper by Bordenave, Chafai and Garcia-Zelada. The function F is itself a Poisson analog of the Gaussian Holomorphic Chaos, and I will list some questions regarding its coefficients and its boundary behaviour

Dans cet exposé, je présenterai une recette pour déduire l'asymptotique d'un tableau multidimensionnel infini de nombres à partir de sa fonction génératrice. Dans le cas bivarié, cela revient à déduire l'asymptotique de a_{m,n} quand m,n -> infini et m/n^T -> s (où T>0 est fixé et s>0 est une variable) à partir de la fonction A(x,y)= Sum_{m,n\geq 0} a_{m,n} x^m y^n. J'expliquerai pourquoi de telles asymptotiques sont utiles dans l'étude de modèles probabilistes, en particulier pour établir des théorèmes limites locales avec des lois limites exotiques. Je donnerai quelques exemples issus des modèles de graphes aléatoires décorés. Auparavant, des recettes similaires n'étaient disponibles que dans le cas où ?=1 et où la fonction A est rationnelle. En revanche, notre méthode fonctionne pour tout T>0 et toute fonction algébrique A, mais sous certaines conditions supplémentaires sur la structure de singularité de A. Si le temps le permet, j'expliquerai pourquoi les anciennes et les nouvelles méthodes traitent des cas disjoints, et comment ils pourraient être combinés dans le futur.

Les principaux séminaires

  • Séminaire de probabilités et statistique
  • Séminaires systèmes dynamiques et géométrie
  • Séminaire de géométrie algébrique
  • Séminaire de physique mathématique et topologie algébrique
  • Théorie Spectrale et Équations aux Dérivées Partielles
  • Colloquium
  • Groupe de travail Structures d’Airy
  • Groupe de travail « Cohomologie prismatique
  • Séminaire Quimpériodique
  • Journées réelles du CHL, Angers-Brest-Nantes-Rennes

Site hébergé par l'Université d'Angers.
Directeurs de la publication : Hélène Maynadier-Gervais et Laurent Meersseman