Les questions / réponses sont classés en 5 thèmes. N’hésitez pas à nous contacter si vous avez des questions dont vous ne trouveriez pas la réponse ici.
Prérequis et admission
Le Mastère Spécialisé® Big Data n’est pas un enseignement où on apprend simplement des briques technologiques qui peuvent être très vite obsolètes. Nous préférons transmettre un certain nombre de connaissances pour être capable de progresser, car c’est un champ qui évolue très vite. Avoir le langage formel avec un niveau de licence solide en mathématique, des bases en calcul numérique, probabilité, statistique et optimisation est indispensable.
La formation est progressive. Il ne s’agit pas d’attaquer dès au début du cursus les concepts avancés en mathématique ou en informatique. Le premier trimestre se focalise sur des séances de remise à niveau. Les élèves travaillent en groupe, les plus à l’aise en mathématique aident les autres.
Nous proposons un MOOC « Fondamentaux pour le Big Data » sur la plateforme France Université Numérique (FUN) qui permet d’évaluer son niveau. Si un candidat le valide, il a le niveau suffisant pour suivre la formation de Mastère Spécialisé®.
Mathématiques
- Analyse : suites/séries numériques, éléments de calcul différentiel, éléments d’analyse de Fourier, d’analyse Hilbertienne
- Algèbre : espaces vectoriels, applications linéaires, calcul matriciel, produits scalaires, formes quadratiques
- Optimisation : multiplicateurs de Lagrange, descente de gradient
- Statistique : expérience aléatoire, estimateur, risque, maximum de vraisemblance, moindres carrés, intervalles de confiance, tests statistiques
- Probabilité : lois de probabilités, vecteurs aléatoires, loi/espérance conditionnelle, loi des grands nombres, théorème de la limite centrale, chaînes de Markov
Informatique
Programmation en Java
- Concepts de base : comment définir une variable, structures de contrôle : boucles for, for each, while
- Classes et objets : comment définir une classe, les attributs, les méthodes ; concepts de public, private, protected ; différence entre une variable ou méthode static ou normale (non-static) ; l’héritage : comment étendre une classe (extends) ; les interfaces : comment définir une interface et l’implémenter dans une classe ; le polymorphisme : comment surcharger une méthode, comprendre comment marchent les méthodes surchargées
- Bases de la bibliothèque standard de Java : collections (ArrayList, HashMap, HashSet, etc.) ; comment insérer un item dans une liste, supprimer un item au début, à la fin, ou au milieu ; quand utiliser les collections (par exemple ArrayList versus LinkedList).
- Comment prendre une description mathématique ou textuelle d’un algorithme et l’implémenter.
Programmation en Python
- Maîtriser les concepts équivalents à ceux de Java ci-dessus (sauf public, private, protected et les interfaces).
- Unix/Linux
- Maîtriser les commandes de base.
Télécom Paris possède aussi un incubateur. L’Ecole collabore avec des personnes compétentes, capables d’être multi facettes et multi tâches, et qui ont le pouvoir de mettre en œuvre toutes les compétences dans le domaine de la science des données, de l’acquisition des données à la production d’un service. Des éléments que l’on peut découvrir de façon très exhaustive dans la formation, qui est très dense. Il n’est pas nécessaire de prévoir d’autres sujets à aborder en parallèle de la formation.
Nous recherchons des personnes qui ont impérativement des compétences en informatique et en mathématique. Nous avons également besoin des candidats curieux, motivés, et qui ont une passion pour les données. Des personnes qui veulent comprendre comment on met en place les systèmes d’analyse et découvrir ce qui est caché dans les données. Ils doivent avoir une démarche de recherche, être capable de lire des articles scientifiques.
Enfin, beaucoup d’importance est accordée pendant l’entretien à la cohérence du projet professionnel. Il faut être capable de se projeter et d’avoir une démarche cohérente.
- Diplôme d’ingénieur en informatique ou en télécommunications,
- Master universitaire scientifique ou technique, en informatique ou en mathématiques appliquées,
- Diplôme (bac+4) scientifique ou technique en informatique ou mathématiques appliquées et au moins 3 ans d’expérience professionnelle,
- Diplômes étrangers de niveau équivalent à (bac+5), MSc ou MBA, en informatique ou mathématiques appliquées.
En raison du grand nombre de dossiers reçus, il ne nous est pas possible de pré-évaluer les dossiers ou de faire passer des entretiens avant le processus de recrutement. Nous vous conseillons de lire attentivement cette FAQ avant de vous décider à postuler. Vous pouvez également consulter les interviews de trois étudiants du Mastère Spécialisé® :
Contenu de la formation et déroulement de l’année
Il y a également tous les jeudis un séminaire professionnel qui donne la possibilité aux élèves d’interagir avec des entreprises qui sont aussi des futurs recruteurs. Il permet de faire découvrir les enjeux du Big Data dans de nombreux domaines (santé, finance, énergie, marketing…). Des salons sont organisés à Télécom Paris, comme le Forum des Mastères Spécialisés au mois de mars et les élèves sont invités aux salons Big Data Paris en mars et DataJob en novembre.
Enfin les élèves peuvent interagir avec les élèves ingénieurs, avec qui ils partagent certains des cours.
Nous avons trois cours supervisés par le département SES. Un cours autour des données Internet où il est question de propriété intellectuelle et de droit, un cours sur l’écosystème Big Data avec beaucoup d’intervenants extérieurs, des grands groupes comme des start-up et des institutions gouvernementales pour réfléchir à la création de valeurs à partir des données, et un cours plus spécifique sur l’économétrie du Big Data.
Il y a aussi un séminaire professionnel tous les jeudis où on fait venir des représentants de divers secteurs d’activités : la santé, la défense, l’e-commerce, la finance, l’assurance… pour partager avec les étudiants leurs expériences de gestion du Big Data. Cette partie valorisation économique est très présente dans la formation, qui reste par ailleurs très technique.
En France, cela ne peut se faire aujourd’hui qu’au niveau d’une école d’ingénieur comme Télécom Paris et c’est là qu’est notre background et notre légitimité. L’une des particularités de Télécom Paris, c’est que ses chercheurs travaillaient déjà en étroite collaboration avec les entreprises avant l’émergence du concept du Big Data. Télécom Paris avait donc déjà une expérience et une crédibilité dans ces domaines. Il suffit de regarder par exemple la liste non exhaustive des publications de nos enseignants chercheurs sur le site de la chaire Machine Learning for Big Data.
La période de stage (thèse professionnelles) dure ensuite entre 4 mois minimum et 6 mois, à partir du mois de juin.
Il n’est pas envisageable d’avoir une activité en parallèle du Mastère Spécialisé®, il s’agit véritablement d’une formation à temps complet. Les personnes qui ne seraient pas 100% disponibles peuvent plutôt s’orienter vers le Certificat d’études spécialisées (CES) « Data Scientist ».
Stages, projets et thèses professionnelles
Les groupes travaillent en mode gestion de projet mais les notes sont individualisées. Ces projets sont apportés et encadrés par des entreprises et s’appuient sur une problématique concrète et des données réelles. L’objectif est de permettre aux étudiants d’aborder toutes les facettes du big data : acquisition, stockage, analyse, assortie d’une réflexion sur la propriété des données, notamment les questions de droit.
Entreprises partenaires
Télécom Paris apporte son savoir aux entreprises en formant des experts répondant aux besoins du marché. En retour les entreprises viennent nous parler de leur vision dans le cadre du séminaire du big data qui se tient tous les jeudis à Télécom Paris. Elles viennent expliquer comment le big data impacte l’organisation de leur DSI, les nouveaux marchés, et comment ils essayent d’anticiper les questions.
Elles peuvent intervenir aussi dans les cours en présentant des points techniques comme dans le domaine de la cybersécurité et de la biométrie. Elles peuvent mettre leurs données à disposition dans le cadre de challenges notés. Elles proposent et encadrent des sujets pour les projets fil rouge, pendant lesquels les élèves ont accès aux données réelles des entreprises. Dans le même temps, ils perçoivent les réalités du terrain. Enfin elles proposent une grande quantité de stages dans des domaines très variés.
Débouchés
D’un point de vue notoriété, la première promotion a déjà fait ses preuves au sein d’entreprises variées (grands groupes internationaux comme start-up). Les étudiants reçoivent toutes les semaines des propositions de stage ou d’embauche.