Des compétences mathématiques. Elles forment la majeure de la formation. La data science s’appuie fortement sur l’analyse statistique de l’information. Bien que les méthodes statistiques classiques (statistique inférentielle, datamining, classification, ..) forment un socle de compétences nécessaires et importantes enseigné, l’aspect « big data » nécessite l’acquisition de techniques statistiques et algorithmiques spécifiques modernes (machine learning, deep learning,..), souvent issues de la recherche récente, et avec de forts liens avec l’optimisation. Ces différents outils constituent la partie principale de la formation mathématique proposée dans ce master. L’analyse statistique étant souvent associée à la question de la modélisation du problème, une formation à la modélisation aléatoire, notamment dans les domaines d’applications visés par le master, est également dispensée.
Des compétences informatiques. Les compétences mathématiques sont inopérantes sans outils informatiques. La connaissance et la pratique récurrente des outils classiques de data analytics (analyse des données avec Python et R) et de data management (SGBDR et moteur de stockage MySQL, ..), font partie intégrante de la formation. L’aspect « données de grandes dimensions et/ou non structurées » interdisant généralement un traitement classique des données, des compétences spécifiques sur ces questions sont naturellement dispensées dans ce parcours: MapReduce et environnement Hadoop/HDFS, entrepôts de données Hive, analyse de données avec PIG (Extract, Load, Transform),… L’aptitude à la visualisation des données de grandes dimensions, images et graphes, fait également partie du champ de compétences visé. Enfin, au travers de cours spécifiques intégrant les réseaux de neurones (Traitement d’Images/Apprentissage par renforcement et Modèles génératifs…), la mise en oeuvre de ce type d’algorithmes sur Pytorch/Keras fait enfin l’objet d’un nombre d’heures d’enseignement conséquent.
Des aptitudes professionnelles. Le master DS vise à former des cadres aptes à définir un projet, ses objectifs et son contexte, les modalités de réalisation, leurs priorités, leurs plannings. L’aptitude à travailler en mode projet, à s’intégrer dans un milieu professionnel, à organiser une veille technologique, à communiquer (en français et en anglais – certification) selon des supports de communication adaptés, sont autant de compétences également dispensées et évaluées au cours des deux années de formation.
Des compétences métiers. Suivant le choix d’option, le diplômé du master parcours data science dispose de compétences complémentaires:
-
- en biologie le faisant apte à s’intégrer dans des équipes pluridisciplinaires de R&D s’intéressant aux traitements et à l’analyse des données (notamment omiques, génomiques, etc..) relevant de la santé, du végétal, etc.. Il peut interagir dès la conception des expériences et des méthodologies mises en œuvre, puis dans l’analyse et le traitement statistiques des données, l’interprétation et la présentation des résultats, jusqu’à la modélisation mathématique des phénomènes observés.
- en économie-gestion et numérique pour des métiers visant d’un côté le management du risque, l’optimisation des actions de l’entreprise sur la base de faits statistiquement fiables et d’un autre côté les métiers reliés directement au web (e-commerce, chatbots,…). Compétences complémentaires logiciels : SAS.