Responsable : Mikael Escobar-Bach
Séminaires à venir
On parlera de grenouilles qui se promènent, se réveillent les unes les autres et s'endorment quand elles restent seules trop longtemps. Ce système de particules en interaction, appelé marches aléatoires activées, a émergé comme une variante d'un modèle de tas de sable qui avait été proposé par des physiciens dans les années 1980 pour illustrer le phénomène de "criticité auto-organisée". L'exposé présentera un résultat récent qui montre que certaines prédictions des physiciens, qui semblent finalement fausses pour le tas de sable, s'avèrent correctes pour les marches aléatoires activées.
TBA
La communauté microbienne complexe qui vit dans le système digestif humain, connue sous le nom de microbiote intestinal, remplit de nombreuses fonctions importantes pour son hôte et est désormais reconnue comme un facteur crucial dans le maintien de la santé. De nombreuses études suggèrent qu'il pourrait être utilisé comme outil médical pour le diagnostic, le pronostic et même la prédiction de la réponse au traitement d'un patient. Cependant, la structure spécifique du microbiote intestinal (notamment parcimonieuse, compositionnelle et avec une structure hiérarchique) a été peu prise en compte jusqu'à présent. En s'inspirant de l'approche Poisson-Log-Normal (PLN) développée pour modéliser les données de comptage dépendantes, nous introduisons le modèle PLN-Tree, spécifiquement conçu pour modéliser des données de comptage hiérarchiques. En intégrant des techniques d'inférence variationnelle structurée, nous proposons une procédure d'apprentissage adaptée et établissons des résultats d'identifiabilité. Des évaluations numériques sur des données synthétiques ainsi que sur des données de microbiote démontrent l'intérêt de prendre en compte la structure hiérarchique des données pour détecter des dépendances complexes.
TBA
TBA
Séminaires passés
La loi d'une somme de variables aléatoires indépendantes uniformément distribuées sur [0,1] est appelée « loi d'Irwin-Hall ». D'autre part, le nombre de partitions d’un ensemble fini en un nombre donné de sous-ensembles est connu sous le nom de « nombre de Stirling de deuxième espèce ». Durant ma présentation, qui mêlera probabilité et combinatoire, je démontrerai qu'un moment de la loi d'Irwin-Hall peut s'exprimer comme un quotient entre un nombre de Stirling de deuxième espèce et un coefficient binomial.
Nous étudions les propriétés des solutions d'équations de Volterra stochastique à drift affine à l'échelle (c'est-à-dire avec une dérive affine de retour à la moyenne) en termes de stationnarité à la fois à un horizon fini et à long terme. En particulier, nous prouvons qu'une telle équation n'a jamais de régime stationnaire, sauf si le noyau est constant (c'est-à-dire que l'équation est une diffusion brownienne standard) ou dans certains contextes pathologiques complètement dégénérés. Nous introduisons un stabilisateur déterministe associé au noyau qui peut produire un régime stationnaire factice dans le sens où toutes les marginales partagent la même espérance et la même variance. Nous montrons également que les marginales d'un tel processus au départ de diverses valeurs initiales sont confluentes dans L^2 lorsque le temps tend vers l'infini. Nous établissons que pour certaines classes de coefficients de diffusion (racine carrée de polynômes quadratiques positifs) les solutions décalées dans le temps de telles équations de Volterra convergent faiblement fonctionnellement vers une famille de processus L^2-stationnaires partageant la même fonction de covariance. Nous appliquons ces résultats à une famille de modèles de volatilité grossière quadratiques stabilisés (lorsque le noyau K(t)=t^(H-\1/2})Gamma(H+\frac 12)}^(-1), 0
Classiquement si X et Y sont independants et si U=f(X,Y) et V=g(X,Y) il y a des dizaines d'exemples ou U et V sont aussi independants avec les fonctions f, g et les lois de X et Y bien choisies. Il y a caracterisation quand la reciproque est vraie. Exemples: Mark Kac avec f(X,Y)=X+Y et g(X,Y)=X-Y caracterise la loi normale. Eugen Lukacs avec f(X,Y)=X+Y et g(X,Y)=Y/X caracterise les lois gamma. Une abstraction et une classification de ces questions est due a la mathematicienne japonaise Sasada et ses collaborateurs, de facon assez profonde, qui ont exhibé de nombreux nouveaux exemples, chacun d'entre eux présentant un défi de caracterisation. Nous presentons trois exemples de complexité croissante auquels nous avons participé avec Jacek Wesolowski et autres coauteurs.
Classiquement si X et Y sont indépendants et si U=f(X,Y) et V=g(X,Y) il y a des dizaines d'exemples ou U et V sont aussi indépendants avec les fonctions f, g et les lois de X et Y bien choisies. Il y a caractérisation quand la réciproque est vraie. Exemples: Mark Kac avec f(X,Y)=X+Y et g(X,Y)=X-Y caractérise la loi normale. Eugen Lukacs avec f(X,Y)=X+Y et g(X,Y)=Y/X caractérise les lois gamma. Une abstraction et une classification de ces questions est due à la mathématicienne japonaise Sasada et ses collaborateurs. Ils ont exhibé de nombreux nouveaux exemples, chacun d'entre eux présentant un défi de caractérisation. Nous présentons trois exemples de complexité croissante auxquels nous avons participé avec Jacek Wesolowski et autres coauteurs.
Un nouvel estimateur de densité multivariée pour des variables stationnaires est obtenu à partir de la fonction caractéristique empirique seuillée. Cet estimateur ne dépend pas du choix des paramètres liés à la régularité de la densité; il est directement adaptatif. Nous établissons des inégalités oracle valables pour des séquences indépendantes, alpha-mélangées et tau-mélangées. Sur des classes de Sobolev anisotropes générales, l'estimateur s'adapte à la régularité de la densité inconnue mais réalise également une adaptabilité directionnelle. En particulier, si A est une matrice inversible, si les observations sont tirées de X dans Rd, il atteint la vitesse induite par la régularité de AX, qui peut être plus régulière que X. L'estimateur est facile à mettre, il dépend de la calibration d'un paramètre pour lequel nous proposons une procédure de sélection numérique innovante, utilisant la caractéristique d'Euler des zones seuillées. (En collaboration avec S. Ammous, J. Dedecker)
Stochastic diffusions are widely used to model physical phenomena, with noise playing a key role in capturing average effects that do not need to be explicitly defined. However, the proposed model is always an approximation and cannot exactly reproduce all aspects of the real system (such as the mean, variance, or higher-order moments). When a discrepancy between the model and the real system is observed, it is natural to refine the model to better account for this difference. Based on the Gibbs conditioning principle, this talk presents a systematic approach to constrain the distribution of a diffusion process at each time point. A thorough regularity analysis is performed on the corrected process, and quantitative stability is explored by perturbing the constraints, demonstrating the robustness of the correction procedure. This work is a collaboration with Giovanni Conforti and Julien Reygner.
The main topic of the talk is a nonparametric Bayesian approach to estimation of the volatility function of a stochastic differential equation (SDE) driven by a gamma process. The volatility function is assumed to be positive and Hölder continuous. We first show that the SDE admits a weak solution that is unique in law under a simple growth condition. In the statistical problem, the volatility function is always modelled a priori as piecewise constant on a partition of the real line, and we specify an inverse gamma prior on its coefficients. This leads to a straightforward procedure for posterior inference. We show posterior consistency and that the contraction rate of the posterior distribution depends on the Hölder exponent. Related work is on a Bayesian approach to volatility function estimation for diffusion processes and to intensity estimation for counting processes. Common features are modelling with a priori piecewise constant functions, whereas the underlying true ones are (Hölder) continuous. Moreover, the contraction rates turn out to be the same in all discussed situations. Based on joint work with Denis Belomestny, Shota Gugushvili, Moritz Schauer and Frank van der Meulen.
Motivated by the mean-field optimization model of the training of two-layer neural networks, we propose a novel method to approximate the invariant measures of a class of McKean-Vlasov diffusions. We introduce a proxy process that substitutes the mean-field interaction with self-interaction through a weighted occupation measure of the particle's past. If the McKean-Vlasov diffusion is the gradient flow of a convex mean-field potential functional, we show that the self-interacting process exponentially converges towards its unique invariant measure close to that of the McKean-Vlasov diffusion. As an application, we show how to learn the optimal weights of a two-layer neural network by training a single neuron.
Dans cette présentation, nous étudierons la prédiction conformelle dans le cadre de l'apprentissage fédéré "one-shot". L'objectif est de calculer des ensembles de prédictions marginalement et conditionnellement valides en un seul tour de communication entre les agents et le serveur. En utilisant le quantile-des-quantiles et la méthode split-CP, nous introduisons plusieurs algorithmes pour construire ces ensembles. Nos approches s'appuient sur de nouveaux résultats théoriques liés aux statistiques d'ordre et à l'analyse de la distribution bêta-bêta. Nous prouvons également des limites supérieures sur la couverture des ensembles lorsque les scores de non-conformité sont presque sûrement distincts. Pour les algorithmes avec des garanties conditionnelles, ces bornes sont du même ordre de grandeur que celles du cas centralisé. Remarquablement, cela implique que le cadre de l'apprentissage fédéré one-shot n'entraîne pas de perte significative par rapport au cas centralisé. Nos expériences confirment que ces algorithmes renvoient des ensembles de prédictions dont la couverture et la longueur sont similaires à celles obtenues dans un cadre centralisé.
Consider a doubly infinite branching tree in varying environment. The genealogy of the current generation backwards in time is uniquely determined by the coalescent point process (Ai: i=1,2,...) where Ai is the coalescent time between individuals i and i+1. In general, this process is not Markovian. We define a vector valued Markov process with the minimal amount of information to reconstruct the genealogy of the standing population.
In this talk we consider a $d$-dimensional stochastic process $X$ which arises from a Lévy process $Y$ by partial resetting, that is the position of the process $X$ at a Poisson moment equals $c$ times its position right before the moment, and it develops as $Y$ between these two consecutive moments, $c \in (0, 1)$. We focus on $Y$ being a strictly $\alpha$-stable process with $\alpha\in (0,2]$ having a transition density. We analyze properties of the transition density $p$ of the process $X$. We establish a series representation of $p$. We prove its convergence as time goes to infinity (ergodicity), and we show that the limit $\rho_{Y}$ (density of the ergodic measure) can be expressed by means of the transition density of the process $Y$ starting from zero, which results in closed concise formulae for its moments. We show that the process $X$ reaches a non-equilibrium stationary state. Furthermore, we check that $p$ satisfies the Fokker-Planck equation, and we confirm the harmonicity of $\rho_{Y}$ with respect to the adjoint generator. In detail, we discuss the following cases: Brownian motion, isotropic and $d$-cylindrical $\alpha$-stable processes for $\alpha \in (0,2)$, and $\alpha$-stable subordinator for $\alpha\in (0,1)$. We find the asymptotic behavior of $p(t;x,y)$ as $t\to +\infty$ while $(t,y)$ stays in a certain space-time region. For Brownian motion, we discover a phase transition, that is a change of the asymptotic behavior of $p(t;0,y)$ with respect to $\rho_{Y}(y)$. In the generated case of $Y_t=t$, our process $X$ becomes an additive-increase and multiplicative-decrease (aka growth-collapse) process that grows linearly in time and that experiences downward jumps at Poisson epochs that are proportional to its present position. For this process, and also for its reflected versions, we solve one- and two-sided exit problems that concern the identification of the laws of exit times from fixed intervals and half-lines.
We study the probability that an autoregressive Markov chain X_{n+1} = a X_n + Y_{n+1}, where 0 < a < 1 is a constant, stays non-negative for a long time. We find the exact asymptotics of this probability and the weak limit of X_n conditioned to stay non-negative, assuming that the i.i.d. innovations Y_n take only two values +1, -1 and a <= 2/3. This limiting distribution is quasi-stationary. The limiting distribution has no atoms and is singular with respect to the Lebesgue measure when 1/2 < a <= 2/3, except for the case a = 2/3 and P(Y_n=1)=1/2, where it is uniform on the interval [0,3]. This is similar to the properties of Bernoulli convolutions. It turns out that for the +1, -1 innovations there is a close connection between X_n killed at exiting [0, \infty) and the classical dynamical system defined by the piecewise linear mapping x -> ( x/a + 1/2) mod 1. Namely, the trajectory of this system started at X_n deterministically recovers the values of the killed chain in reversed time! We use this property to construct a suitable Banach space, where the transition operator of the killed chain has the compactness properties that let us apply a conventional argument of Perron--Frobenius type. The difficulty in finding such space stems from discreteness of the innovations.
To study of a (stochastic) optimal control problem, there are two main technics: the dynamic programming principle which leads to the Hamilton-Jacobi-Bellman (HJB) partial differential equation, or the Pontryagin maximum principle, which leads to the adjoint backward (stochastic) differential equation. If a constraint on the terminal value of the state process X is imposed, for example T)=0, there is a terminal blow-up for the HJB equation or the adjoint equation. In this talk, we evoke some known results for backward stochastic differential equations (BSDEs) without or with terminal singularity and the link with stochastic control with terminal constraint. We also define the continuity problem: is the solution continuous at the terminal time, despite the singularity ? In other words is there an extra cost in the related control problem, because of the strong constraint ? We show that continuity holds if the problem is sufficiently non linear (existence of a critical value). Below this value, the result still holds in the Brownian setting, using Malliavin’s calculus. However we show that a jump part propagates the singularity: there is a discontinuity at the terminal time in the Poisson case. Based on joint works with D. Cacitti-Holland (Le Mans), L. Denis (Le Mans), T. Kruse (Wuppertal, Germany).
As systems have become more sophisticated, there has been an increase in the number and nature of their components. Some of them show continuous degradation and others fail suddenly without warning. Another approach to take into account is that the degradation processes affecting the system may appear at different times, triggered by an external process. Some maintenance strategies for systems subject to multiple degradation processes are proposed. Such systems can refer to systems with multiple components or systems subject to different degra- dation processes. Both points are equivalent in the following sense: systems subject to different degradation processes can be seen as a system of multiple components where not all the components start to deteriorate at the same instant of time. Since the introduction of continuous degradation processes, such as the Gamma or the Wiener processes, several extensions of these models have been proposed in order to offer a closer approach to real-life situations. A random effects model in which a parameter of the main degradation process follows a random variable is analysed. This allows the variability between the different degradation processes to be represented. In addition, dependencies that arise between components are addressed by studying the Pearson's correlation coefficient in the case of imperfect repairs in a system subject to a bivariate degradation.
We use the concept of excursions for the prediction of random variables without any moment existence assumptions. To do so, an excursion metric on the space of random variables is defined which appears to be a kind of a weighted L1-distance. Using equivalent forms of this metric and the specific choice of excursion levels, we formulate the prediction problem as a minimization of a certain target functional which involves the excursion metric. Existence of the solution and weak consistency of the predictor are discussed. An application to the extrapolation of stationary heavy-tailed random functions illustrates the use of the aforementioned theory. Numerical experiments with the prediction of Gaussian, alpha- and max-stable random functions show the practical merits of the approach. Joint work with A. Das and V. Makogin
Dans cet exposé, on considère l'enveloppe convexe des points d'un processus ponctuel de Poisson dans la boule unité euclidienne, lorsque la dimension tend vers l'infini, et nous étudions plus précisément la fonction de support de ce polytope poissonnien. Nous en identifierons d'abord les différents régimes asymptotiques, selon l'intensité du nombre de points échantillonnés, et nous les comparerons à ceux obtenus par Bonnet-Kabluchko-Turchi (RSA, 2020) pour le volume moyen occupé. Nous présenterons ensuite des résultats de convergence en loi pour une certaine renormalisation de la fonction de support, en faisant (si le temps le permet) le lien avec un problème de recouvrement résolu par Janson (Acta Math., 1986). Il s'agit d'un travail en cours de finalisation et en collaboration avec Pierre Calka (LMRS, Université de Rouen Normandie).
A quoi ressemble une forêt aléatoire d'un grand graphe complet, vue d'un sommet typique ? Pour l'arbre couvrant uniforme (c'est-à-dire une forêt avec une seule composante), Grimmett a répondu à cette question il y a longtemps : la limite locale est un arbre de Bienaymé-Galton-Watson critique, de loi de reproduction de Poisson, conditionné à survivre éternellement. Depuis, des modèles de forêt aléatoire ont connu un intérêt constant, voir par exemple les travaux de Kenyon et de Avena-Gaudillière et coauteurs (entre autres). Dans cet exposé, j'introduirai un modèle de forêt aléatoire naturellement motivé par l'étude du champ gaussien massique. Pour le graphe complet, on peut décrire la limite locale assez précisément : une transition de phase sépare les masses pour lesquelles la situation est identique aux arbres d'une où un nouvel objet limite apparait. On décrira certaines caractéristiques de cet objet, comme la loi du degré d'un sommet typique. Exposé basé sur un travail en collaboration avec Nathanaël Enriquez (IMO Orsay et ENS Ulm) et Paul Melotti (IMO Orsay).