Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:start

Ceci est une ancienne révision du document !


5I852 BDLE : Bases de Données Large Echelle (2019-2020) Sous construction ...

Années précédentes

EDT UPMC Master

Salle Cours (A faire) :

  • Jusqu'au xx-xx-2019 inclus : Salle xx xx/xx
  • A partir du xx-xx-20xx : Salle xx xx/xx

Salles TME :

  • Groupe 1 : xx Tour 14/15
  • Groupe 2 : xx Tour 14/15

Mails Equipe pédagogique :

  • bernd.amann@lip6.fr
  • mohamed-amine.baazizi@lip6.fr (responsable)
  • camelia.constantin@lip6.fr
  • hubert.naacke@lip6.fr

Description

L’explosion de données conduit à reconsidérer radicalement les méthodologie de traitement de celles-ci tant au niveau performance et efficacité d’accès qu’au niveau acquisition, préparation et structuration. Les plateformes se basant sur le paradigme MapReduce ont été mises oeuvre pour relever ces deux défis à la fois et sont en continuelle évolution pour répondre aux besoins croissants en terme d’analyse de données massives.

Ce cours permet de se familiariser avec la méthodologie de traitement de données massives qui s’articule autour de deux axes : i) collecte, agrégation et génération de données et ii) analyse de données. Le premier axe sera abordé sous l’angle de la nouvelle démarche de manipulation et d’exploration de données massives dénotée REPL (Read Evaluate Print Loop) fortement inspirée des systèmes d’analyse comme R. Le système Spark, fortement répandu, est étudié et utilisé tout au long du cours. Le second axe sera abordé selon deux cas d’études : a) analyse de données multidimensionnelles à l’aide de requêtes SQL sur des cubes de données , b) analyse statistique de graphes sociaux en utilisant des techniques connues (PageRank, Hits, etc) et c) et interrogation de graphes de données à l’aide de langages récents tels que Cipher de Neo4J.

Liens utiles

Planning

Semaine Date Theme Cours TME Gr1 Gr2
1 20-09-2018 Prépration, analyse et visualusation de données massives 1/3 H. Naacke B. Amann
2 27-09-2018 Prépration, analyse et visualusation de données massives 2/3 H. Naacke B. Amann
3 04-10-2018 Prépration, analyse et visualusation de données massives 3/3 H. Naacke B. Amann
4 11-10-2018 Introduction à MapReduce - Spark et Scala M-A. Baazizi ??
5 18-10-2018 Interrogation données relationnelles et semi-structurées en Spark M-A. Baazizi ??
6 25-10-2018 Architecture Map-Reduce et modèle d’exécution de Spark 1/2 M-A. Baazizi ??
01-11-2018 Toussaint
7 08-11-2018 Architecture Map-Reduce et modèle d’exécution de Spark 2/2 M-A. Baazizi ??
15-11-2018 Révisions
22-11-2018 Examen réparti 1
8 29-11-2018 Stockage H. Naacke ??
9 06-12-2018 Optimisation H. Naacke ??
10 13-12-2018Tuning H. Naacke ??
11 20-12-2018 Graphes en RDD Cours 11graphes-spark C.Constantin ??
27-12-2018 vacances de fin d'année
03-01-2018 vacances de fin d'année
12 10-01-2019 API GraphX Cours 12-13 graphes-graphxC.Constantin ??
13 17-01-2019 API GraphX Cours 12-13 graphes-graphx C.Constantin ??
14 24-01-2019 Requêtes graphes - Récursion Neo4J Cours 14Calculs sur les graphes en Neo4J C.Constantin ??
31-01-2019Révisions
07-02-2019Examen réparti 2

Annales

Les solutions (SANS GARANTIE!) seront migrées au fur et à mesure ici lien

Accès réservé aux enseignants :

site/enseignement/master/bdle/start.1563796779.txt.gz · Dernière modification: 22/07/2019 13:59 par amine