Responsable : Rodolphe Garbit
Séminaires à venir
De nos jours, les procédures de machine learning sont utilisées dans beaucoup de champs d’applications à l'exception notables des domaines dits sensibles (santé, justice, défense pour n'en citer que quelques-uns) dans lesquels les décisions à prendre sont lourdes de conséquence. Dans ces domaines, il est nécessaire d'obtenir une décision précise mais, pour entrer effectivement en application, ces algorithmes doivent fournir une explication du mécanisme qui conduit à la prise de décision et, en ce sens, être interprétable. Malheureusement les algorithmes les plus précis actuellement sont souvent les plus complexes. Une technique classique pour tenter d'expliquer leurs prédictions consiste à calculer des indicateurs correspondant à la force du lien entre chaque variable d’entrée et la variable de sortie à prédire. Dans cet exposé, nous nous intéresserons à un indicateur d'importance créé pour les arbres de décision, le Mean Decrease Impurity, et nous verrons en quoi l'étude théorique permet de fournir des explications quant à son utilisation pratique.
TBA
Séminaires passés
We propose a mathematical model on the oncolytic virotherapy incorporating virus-specific CTL response, which contribute to killing of infected tumor cells. In order to improve the understanding of the dynamic interactions between tumor cells and virus-specific CTL, stochastic differential equation models are constructed. We obtain sufficient conditions for existence, persistence and extinction of the stochastic system. In relation to the therapy control, we also analyze the stochasticity role of equilibrium point stabilities. The Monte Carlo algorithm is used to estimate the mean extinction time and the extinction probability of cancer cells or viruses-specific CTLs. Our simulations highlighted the switch of the system leaving the attractor basin of the three species co-existence equilibrium towards that of cancer cell extinction or that of virus specific CTLs depletion. This allowed us to characterize the spaces of cancer control parameters. Finally, we determine the model solution robustness by analyzing the sensitivity of the model characteristic parameters. Our results demonstrate the highly dependence of the virotherapy success or failure on the combination of stochastic diffusion parameters with the maximum per capita growth rate of uninfected tumor cells, the transmission rate, the viral cytotoxicity and the strength of the CTL response.
Optimal transport (OT) has recently gained lot of interest in machine learning. It is a natural tool to compare in a geometrically faithful way probability distributions. It finds applications in both supervised learning (using geometric loss functions) and unsupervised learning (to perform generative model fitting). OT is however plagued by the curse of dimensionality, since it might require a number of samples which grows exponentially with the dimension. In this talk, I will explain how to leverage entropic regularization methods to define computationally efficient loss functions, approximating OT with a better sample complexity. More information and references can be found on the website of our book "Computational Optimal Transport" https://optimaltransport.github.io/
We study the problem of the non-parametric estimation for the density $\pi$ of the stationary distribution of a stochastic two-dimensional damping Hamiltonian system $(Z_t)_{t\in[0,T]}=(X_t,Y_t)_{t \in [0,T]}$. From the continuous observation of the sampling path on $[0,T]$, we study the rate of estimation for $\pi(x_0,y_0)$ as $T \to \infty$. We show that kernel based estimators can achieve the rate $T^{-v}$ for some explicit exponent $v \in (0,1/2)$. One finding is that the rate of estimation depends on the smoothness of $\pi$ and is completely different with the rate appearing in the standard i.i.d. setting or in the case of two-dimensional non degenerate diffusion processes. Especially, this rate depends also on $y_0$. Moreover, we obtain a minimax lower bound on the $L^2$-risk for pointwise estimation, with the same rate $T^{-v}$, up to $\log(T)$ terms. (joint work with Sylvain Delattre, Univ. Paris Diderot; and Nakahiro Yoshida, Univ. of Tokyo)
In this talk, we start by introducing the intriguing van Dantzig problem which consists in characterizing the subset of Fourier transforms of probability measures on the real line that remain invariant under the composition of the reciprocal map with a complex rotation. We first focus on the so-called Lukacs class of solutions that is the ones that belong to the set of Laguerre-P?lya functions which are entire functions with only real zeros. In particular, we show that the Riemann hypothesis is equivalent to the membership to the Lukacs class of the Riemann ? function. We state several closure properties of this class including adaptation of known results of P?lya, de Bruijn and Newman but also some new ones. We proceed by presenting a new class of entire functions, which is in bijection with a set of continuous negative definite functions, that are solutions to the van Dantzig problem and discuss the possibility of the Riemann ? function to belong to this class.
Le laboratoire de Bioinfomique à l’ICO travaille sur le développement d'outils bio-informatiques pour améliorer les traitements dans les cancers du sein. Notamment, nous cherchons à sélectionner des variables prédictives de la tumeur qui permettraient en amont d’évaluer l’efficacité d'un traitement. Nous utilisons pour cela des algorithmes de machine learning en analyse supervisée. Malheureusement, la construction d’un modèle prédictif est particulièrement ardue en santé car le nombre de variables de la tumeur dépasse largement le nombre d’observations, et les modèles pour l’instant générés ont des performances de prédiction trop faible pour être utilisables en clinique. Afin d’augmenter le nombre d’observations, nous avons ici combiné des datasets provenant d’origine différente en comparant différentes méthodes, et nous avons testé les performances de plusieurs algorithmes sur cette combinaison de données.
Let p(t,x,y) be the fundamental solution of the equation \partial_t u(t,x) = \Delta^{\alpha/2} u(t,x).
I will consider the integral equation
\tilde{p}(t,x,y) = p(t,x,y) + \int_0^t \int_{\mathbb{R}^d} p(t-s,x,z) q(z) \tilde{p}(s,z,y) dz ds,
where q(z) = \frac{\kappa}{|z|^{\alpha}} and \kappa is some constant. The function \tilde{p} solving this equation will be called the Schrödinger perturbations of the function p by q. I will present the results concerning the estimates of the function \tilde{p} in both cases \kappa>0 and \kappa<0.
Dans cet exposé, nous nous intéresserons à la dynamique de Langevin sur-amortie $ d X_t = -U(X_t) dt + \sqrt{2h} d B_t $ dans la limite $ h\to 0 $ lorsque $U: \mathbb{R}^d \to \mathbb{R}^d $ est un champ vectoriel régulier tel que, pour une certaine fonction régulière $V:\mathbb{R}^d \to \mathbb{R}$, la dynamique est invariante par rapport à $ e^{-\frac Vh} $. Nous nous intéresserons plus précisément aux propriétés du bas spectre du générateur de la dynamique, c-à-d $ L = -h \Delta + U \cdot \nabla $, et à leurs liens avec le comportement en temps long de la dynamique dans le régime $h\to 0$. En particulier, lorsque la fonction $V$ est une fonction de Morse admettant $n$ minima locaux, nous montrerons que pour un certain $ \epsilon > 0$, le spectre de $L$ inclus dans la bande $0 \leq \{\mathop{Re}(z) < \epsilon\}$ consiste en $n$ valeurs propres exponentiellement petites. Enfin, sous des hypothèses génériques sur les barrières de potentiel de la fonction $V$, nous montrerons que ces petites valeurs propres satisfont des formules de type Eyring-Kramers. Cela généralise des résultats antérieurs obtenus par de nombreux auteurs dans le cas réversible, i.e. lorsque $U$ est de la forme $ U=\nabla V $.