Ceci est une ancienne révision du document !
Salle Cours :
Salles TME :
Mails Equipe pédagogique :
L’explosion de données conduit à reconsidérer radicalement les méthodologie de traitement de celles-ci tant au niveau performance et efficacité d’accès qu’au niveau acquisition, préparation et structuration. Les plateformes se basant sur le paradigme MapReduce ont été mises oeuvre pour relever ces deux défis à la fois et sont en continuelle évolution pour répondre aux besoins croissants en terme d’analyse de données massives.
Ce cours permet de se familiariser avec la méthodologie de traitement de données massives qui s’articule autour de deux axes : i) collecte, agrégation et génération de données et ii) analyse de données. Le premier axe sera abordé sous l’angle de la nouvelle démarche de manipulation et d’exploration de données massives dénotée REPL (Read Evaluate Print Loop) fortement inspirée des systèmes d’analyse comme R. Le système Spark, fortement répandu, est étudié et utilisé tout au long du cours. Le second axe sera abordé selon deux cas d’études : a) analyse de données multidimensionnelles à l’aide de requêtes SQL sur des cubes de données , b) analyse statistique de graphes sociaux en utilisant des techniques connues (PageRank, Hits, etc) et c) et interrogation de graphes de données à l’aide de langages récents tels que Cipher de Neo4J.
Semaine | Date | Theme | Cours | TME | Gr1 | Gr2 |
---|---|---|---|---|---|---|
1 | 20-09-2018 | Prépration, analyse et visualusation de données massives 1/3 | H. Naacke | B. Amann | ||
2 | 27-09-2018 | Prépration, analyse et visualusation de données massives 2/3 | H. Naacke | B. Amann | ||
3 | 04-10-2018 | Prépration, analyse et visualusation de données massives 3/3 | H. Naacke | B. Amann | ||
4 | 11-10-2018 | Introduction à MapReduce - Spark et Scala | M-A. Baazizi | ?? | ||
5 | 18-10-2018 | Interrogation données relationnelles et semi-structurées en Spark | M-A. Baazizi | ?? | ||
6 | 25-10-2018 | Architecture Map-Reduce et modèle d’exécution de Spark 1/2 | M-A. Baazizi | ?? | ||
01-11-2018 | Toussaint | |||||
7 | 08-11-2018 | Architecture Map-Reduce et modèle d’exécution de Spark 2/2 | M-A. Baazizi | ?? | ||
15-11-2018 | Révisions | |||||
22-11-2018 | Examen réparti 1 | |||||
8 | 29-11-2018 | Stockage | H. Naacke | ?? | ||
9 | 06-12-2018 | Optimisation | H. Naacke | ?? | ||
10 | 13-12-2018 | Tuning | H. Naacke | ?? | ||
11 | 20-12-2018 | Graphes en RDD | Cours 11 | graphes-spark | C.Constantin | ?? |
27-12-2018 | vacances de fin d'année | |||||
03-01-2018 | vacances de fin d'année | |||||
12 | 10-01-2019 | API GraphX | Cours 12-13 | graphes-graphx | C.Constantin | ?? |
13 | 17-01-2019 | API GraphX | Cours 12-13 | graphes-graphx | C.Constantin | ?? |
14 | 24-01-2019 | Requêtes graphes - Récursion Neo4J | Cours 14 | Calculs sur les graphes en Neo4J | C.Constantin | ?? |
31-01-2019 | Révisions | |||||
07-02-2019 | Examen réparti 2 |
Les solutions (SANS GARANTIE!) seront migrées au fur et à mesure ici lien
Accès réservé aux enseignants :