TME Jointure Répartie
L'objectif de ce TME est de comprendre l'évaluation d'une requête de jointure entre 2 relations qui sont situées sur 2 sites distincts.
- définir le schéma global qui offre un accès transparent à des données de plusieurs bases,
- formuler une requête répartie,
- comprendre l'ordre et l'emplacement des opérations permettant d'évaluer une requête répartie (quel site traite quelles opérations?).
Scénario
On dispose de 2 SGBD : site 1 et site 2
Données: Le site 1 contient les Clubs (table C), le site 2 contient les Joueurs (table J)
La couche BDR est implémentée sur le site 1.
Installation
- créer les tables J,C,F (déjà fait lors du TME précédent)
@base3
- supprimer les joueurs J du site 1 (les joueurs seront stockés sur le site 2)
drop table J; desc J (doit répondre: "table inconnue")
- créer la table J des joueurs dans le site 2 (le serveur du site 2 s'appelle ora10)
connect E1234567/E1234567@ora10 --(avec votre propre numéro d'étudiant) @base3 drop table C cascade constraints; drop table F;
Relier les sites :
- La couche BDR (site1) doit pouvoir se connecter au site 2
connect E1234567/E1234567@ora11 drop database link site2; create database link site2 connect to E1234567 identified by "E1234567" using 'ora10'; --(avec votre propre numéro d'étudiant)
- Vérifier le bon fonctionnement du lien
desc J@site2
ajouter un club dans une nouvelle ville. Ce club n'a que 10 joueurs ce qui permettra, par la suite, de poser une requête de jointure très sélective.
insert into C values( 6000, 'petit club', 2, 'Combourg');
Construire le schéma global
create view J as select * from j@site2;
Requêtes réparties
Pour chaque requête, répondre aux questions
- Où est traitée chaque opération (sélection, projection, jointure, ...) ?
- Quelles sont les données transférées entre les sites pendant l'évaluation de la requête ?
- Activer le mode de visualisation des plans et le chronométrage
set timing on set autotrace trace explain stat
R1 : Jointure seule avec un transfert volumineux
Afficher les joueurs avec leur club
select * from J, C where j.cnum = c.cnum;
R2 : jointure avec sélection
select * from J, C where j.cnum = c.cnum and salaire > 59000
La sélection est-elle poussée sur le site 2 ?
R3 Jointure très sélective
- R3a : jointure très sélective et avec un transfert volumineux
select * from J, C where j.cnum = c.cnum and ville = 'Combourg';
- R3b : jointure très sélective et avec un transfert faible. La directive driving_site prend en argument le nom de la variable j1 associée à la relation stockée sur le site dans lequel oracle doit traiter la jointure (i.e. le site 2).
select /*+ driving_site(j1) */ * from J j1, C c1 where j1.cnum = c1.cnum and ville = 'Combourg';
- Proposer d'autres requête pour illustrer les optimisations de requêtes réparties vues en cours.