Table des matières

Ancien TME 2016 : Exécution dans Spark

Exercice 3: Plan d'exécution

Visualiser le plan d'exécution de chaque requête à l'aide de l'interface graphique dans votre navigateur: localhost:4040

Exercice 4: interpréteur de requêtes

a) Proposer une structure pour représenter un motif complexe quelconque formé de plusieurs motifs de triplets reliés entre eux par des variables de jointure. On suppose que le motif complexe est connexe (i.e., il est formé d'une seule composante).

b) Proposer une fonction pour évaluer un motif complexe quelconque.

ANCIENS ENONCES 2015 et 2016

Dataset (vu en 2016)

Voir la définition des Datasets USERS, FILMS et AVIS dans le fichier du tme

RDD (vu en 2015)

Les utilisateurs : USERSRDD (numU, (genre, age, profession, codePostal)). Le numéro d'utilisateur numU identifie un utilisateur. Les notes attribuées par les utilisateurs : RATINGSRDD (numU, (film, note, date))

Voir la définition des RDD USERSRDD, RATINGSRDD dans le fichier du tme

Les données ont été lues puis fragmentées sans critère particulier en 10 et 20 fragments respectivement. Pour vérifier le nombre de fragments d'une RDD :

USERSRDD.partitions.size
RATINGSRDD.partitions.size