Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:sam:start

MU4IN803 : SAM - Stockage et Accès aux Mégadonnées (fév 2020)

(anciennement BDR Bases de Données Réparties)

2021 : voir le site Moodle 4IN803

  • Enseignants: Hubert Naacke et Stéphane Gançarski
  • Cours : le mardi à 16h vérifier la salle avant chaque séance.
  • Groupes 1 et 2: Mardi TME à 8h30 puis TD

Consulter les salles de TME et TD sur le planning du M1. Examen: les documents de cours, TD et TME sont autorisés.

Sujet du devoir maison : DM1

Le TMEJDBC 2020 peut être fait chez soi, localement en utilisant H2. Il n'est plus nécessaire d'accéder au serveur Oracle de la PPTI pour faire ce TME.

Calendrier

Date cours cours Dates TD TD TME à 8h30 ens
28/01 cours 1: Arbres B+ - - -
4/02 cours 2: Hachage dynamique 4/02 TD1: Arbres B+ TME Index 2020 H
11/02 cours 3: Optim de requêtes 11/02 TD2: Hachage TME Index 2020 (2) S
18/02 cours 4: Coût des opérateurs 18/02 TD3: Optim de requêtes TME Jointure H
25/02 cours 5: Conception par fragmentation et réplication 25/02 TD4: Optim de requêtes (suite) TME Jointure (2) H
3/03 cours 6: Traitement des requêtes réparties 3/03 TD5: Requêtes de jointure TME Jointure répartie H
10/03 - révisions - - - - -
17/03 Examen 1 - - - -
24/03 cours 7: Réplication 24/03 TD6: Conception par fragmentation TMEJDBC H
31/03 cours 8: Transactions réparties 31/03 TD7: Requêtes réparties TMEJDBC (2) H
6/04 et 14/04 Vacances - - - -
21/04 cours 9: BD parallèles 21/04 TD8: Requêtes réparties (suite) TMEJDBC (3) H
28/04 cours 10 : Reprise sur panne + démo Spark 28/04 TD9 : Transactions réparties TMEJDBC (4) H
5/05 - 5/05 TD10 Révisions TME 10 sur l'interblocage réparti et révisions H
12/05 - révisions - - - - -
19 mai Examen 2 - - - -
16 juin Session 2 - - - -

Suppports de cours

Supports de TD

Les TME

Lire la doc sur la Connexion au serveur Oracle 11

Divers

Aller vers le site M1 DAC, le planning du M1

Site administratif annuel avec les brèves et doc postés par la scolarité du master.

Ancien site BDR2015 avec des annales. Sujets du partiel 2015, partiel 2016

Une vidéo intitulée: Really Big Data​ Analytics on Graphs with Trillions of Edges (présentation de Willy Zwaenepoel au colloquium 2016)

Le service DynamoDB: voir les paragraphes sur la définition d'une table, d'une clé primaire et des index secondaires.

L'article évoqué dans le cours 3 sur l'optimisation de requêtes : How Good Are Query Optimizers, Really?.

L'article évoqué pendant le TD sur l'optimisation de requêtes : SIGMOD 2017: Access Path Selection in Main-Memory Optimized Data Systems: Should I Scan or Should I Probe?

Le tri parallèle mis en oeuvre pour le SortBenchmark : les rapports d'expérimentation pour les années sortBenchmark 2016 et sortBenchmark 2014

Spanner: OSDI2012, TOCS2013, SIGMOD2017 TrueTime expliqué par E.Brewer (pdf)

Quelques articles intéressants et récents (EDBT 2020)

Coût d'une requête: Un modèle de coût qui est “appris” avec un réseaux de neurones… Est ce que cela veut dire qu'il n'est plus besoin de s’embêter avec des formules de cout ? pas tout à fait… PDF

Des requêtes d’agrégation sur des flux de données : une solution distribuée très efficace: PDF

ML-Index: est ce qu'on peut remplacer les niveaux intermédiaires d'un arbre B+ par un réseau de neurones ? Si oui pour quelles requêtes ? PDF

Transactions réparties: un article plus “système réparti”, pour les étudiants SAR de préférence. L'astuce est d'ordonner globalement de manière déterministe les transactions avant de les exécuter. L'article s'appuie sur la solution Calvin de 2012. Calvin est expliqué de manière résumée et très abordable (pour des Master1) en section 2.1. Le reste est un peu plus difficile à lire. Q-Store: Distributed, Multi-partition Transactions via Queue-oriented Execution and Communication. PDF

Pour les enseignants

site/enseignement/master/sam/start.txt · Dernière modification: 25/01/2021 09:23 par hubert