Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:tmes:sqlrecursif

SQL et récursion

Connexion Oracle

Chargement de Données

Conectez vous à Oracle et

Premiers pas

Créez la table myedges:

DROP TABLE myedges;
CREATE TABLE myedges (
       SOURCE INTEGER, target INTEGER);
INSERT INTO myedges VALUES (1,2);
INSERT INTO myedges VALUES (2,3);
INSERT INTO myedges VALUES (2,4);
INSERT INTO myedges VALUES (4,5);

Questions


Question 1: Dessinez le graphe G stocké dans la graphe myedges;


Question 2: Exécutez la requête suivante et expliquez ce qu'elle affiche.

SELECT DISTINCT target, level, SYS_CONNECT_BY_PATH(SOURCE, '/') path
FROM myedges
START WITH SOURCE=1
CONNECT BY prior target=SOURCE;

Question 3: Affichez tous les pairs de noeuds dans G et la longueur des chemins entre eux (il faut utiliser CONNECT_BY_ROOT). Triez le résultats sour les attributs source et target. Ensuite, affichez également les chemins.


Question 4: Insérez les deux arcs suivants et évaluez à nouveaux les requêtes précédentes (il faudra ajouter le mot clé NOCYCLE après CONNECT BY):

INSERT INTO myedges VALUES (5,1);
INSERT INTO myedges VALUES (4,1);

Question 5: Affichez tous les pairs de noeuds dans G et la longueur des chemins entre eux ainsi l'information si le chemin est un cycle (.


Question 6: Affichez que tous les cycles (source=target) et leur longueur (utilisez la possibilité de mettre une sous-requête SQL dans la clause FROM d'une requête ou créez une vue). Affichez le nombre de cycles.


Question 7: Affichez pour chaque noeud le nombre de cycles.


*Question 8: Exécutez la requête suivante et analysez le résultat. Changez la stratégie de parcours (DEPTH FIRST, BREADTH FIRST) et l'attribut utilisé pour la détection du cycle.

WITH R2(SOURCE,target,l)
AS (
   SELECT SOURCE,target,1 FROM myedges
   UNION ALL
   SELECT r.source, m.target, r.l+1  FROM R2 r, myedges m WHERE m.source=r.target
)
SEARCH breadth FIRST BY SOURCE SET o1
cycle target SET END TO 1 DEFAULT 0
SELECT * FROM R2
ORDER BY o1;

Question 9: Ecrivez une requête qui retourne tous les pairs de noeuds et la longueur du plus court chemin.

Graphe Facebook :

On considère une base de données qui contient des informations (fictives) sur des utilisateurs Facebook et leurs amis. Ces informations sont stockées dans les deux tables suivantes :

Users(id, name, age)
Edges(usr, neighbor)

Les clés primaires sont soulignées. Les attributs usr et neighbor dans la table Edges sont des clés étrangères. La table Users contient 4039 utilisateurs, la table Edges contient 88234 arcs. Le graphe contient 1612010 triangles (voir ce site pour plus d'informations: http://snap.stanford.edu/data/egonets-Facebook.html). Exécutez la commande suivante:

@facebook-bdle
DESC Users 
DESC Edges

Par défaut le graphe est dirigé (e.g on stocke dans Edges seulement les arcs a → b sans stocker aussi les arcs b → a).

Questions


Question 1 : Écrivez une requête SQL sans récursivité qui retourne le nom des amis (voisins) de l'utilisateur 'Kendall' (il existe une seule personne avec ce nom), en considérant que le graphe est dirigé. Écrivez la même requête en considérant que le graphe est non-dirigé.

Résultat: graphe dirigé 7 lignes, graphe non dirigé 9 lignes


Question 2 : Écrivez une requête SQL sans récursivité pour connaître les noms des amis des amis de Kendall (à distance 2 de Kendall), en considérant d'abord que le graphe est dirigé et ensuite non dirigé.

Résultat: graphe dirigé 52 lignes, graphe non dirigé 521 lignes


Question 3 : Donnez une requête hiérarchique (clause CONNECT BY) qui retourn les noms des utilisateurs atteignables dans le graphe dirigé à une distance donnée à partir de l'utilisateur 'Kendall'.

Essayez la requête pour plusieurs distances (pour distance 2 vérifiez que vous obtenez le même résultat que pour la question 2).

Résultat: 52 lignes pour la profondeur 2


Question 3.1 : La question 3 avec une requête récursive (clause WITH).


Question 4 : Affichez tous les chemins de longueur inférieure ou égale à une distance donnée entre 'Kendall' et 'Ricci' en utilisant CONNECT BY. Les requêtes doivent afficher pour chaque chemin sa description et sa longueur. A titre d'exemple, un chemin possible entre Kendall et Ricci est : /Kendall/Shamika/Ricci de longueur 2. Le graphe est considéré comme étant dirigé (Indication : utiliser WITH et SYS_CONNECT_BY_PATH dans la requête hiérarchique).

Résultat: 13 lignes pour profondeur⇐ 4


Question 4.1 : Question 4 en utilisant une requête récursive (clause WITH et sans CONNECT_BY). Pour construire le chemin on peut concaténer deux chaînes de caractères en utilisant || (Exemple: '/' || chaîne ajoute '/' devant chaîne).


Question 4.2 : Au lieu d'exécuter la requête, on veut obtenir des statistiques sur les coûts. Pour cela, il faut exécuter d'abord la commande suivante, avant de reexécuter la requête:

SET autotrace trace stat

Exécutez la requête précédente (ou d'autres requêtes) et étudiez les statistiques observées:

Explications :autotrac.htm

Avant de conteinuer, il faut faire:

SET autotrace off

Question 5 : Donnez une requête qui affiche, pour les utilisateurs 'Kendall' et 'Baylee' l'identifiant de chaque utilisateur atteignable à une profondeur d'exploration de maximum 3, avec la longueur du plus court chemin vers cet utilisateur (les degrés de séparation entre Kendall ou Baylee et les autres utilisateurs). Donnez une solution en utilisant la clause CONNECT BY. (Indication : utiliser la clause CONNECT_BY_ROOT dans la requête hiérarchique). Le graphe est considéré comme étant dirigé.

Résultat: 154 lignes


Question 5.1: Question 5 en utilisant une quête récursive (clause WITH).


Question 6 : Écrivez une requête qui affiche les noms des utilisateurs qui sont atteignables à la fois à partir de 'Kendall' et de 'Donny' par des parcours à une profondeur maximum 3. Donnez une solution en utilisant la clause WITH.

Résultat: 223 ligne(s) sélectionnée(s).


Question 7 : Écrivez en SQL sans récursivité la requête qui calcule le nombre total de triangles contenant l'utilisateur 'Kendall'. Le graphe sera transformé d'abord dans un graphe non dirigé avec la commande suivante :

CREATE VIEW edges_view(usr, neighbor) AS ( 
   SELECT usr, neighbor FROM edges 
 UNION ALL 
   SELECT neighbor,usr FROM edges
);

Résultat: 1612010


Question 8 : Calculez le nombre de triangles contenant 'Kendall' avec une requête hiérarchique (CONNECT BY) et une requête récursive (WITH).

Résultat: 34


*Question 8bis: Calculez l'histogramme du graphe Facebook.


Question 9 (Optionnel) :

Écrivez le code PL/SQL permettant de calculer les noeuds atteignables à partir d'un utilisateur donné comme paramètre. Le code sera écrit dans le fichier proc_fermeture_transitive.sql Vérifiez la procédure avec le script read_start_node_fermeture.sql.

Conseil: Créer une table temporaire pour stocker les noeuds distincts rencontrés pendant la traversée. Le calcul s'arrête lorsqu'il n'y a plus de nouveau noeud à ajouter à la table temporaire.

CREATE GLOBAL TEMPORARY TABLE fermeture (id INTEGER PRIMARY KEY);
 
@proc_fermeture_transitive
@read_start_node_fermeture
 
DROP TABLE fermeture;
DROP TABLE fermeture;

Le fichier read_start_node_fermeture.sql est donné à la fin de l'énoncé.


Question 10 (Optionnel) : Écrivez le code PL/SQL permettant de calculer le nombre de triangles qui contiennent un utilisateur donné comme paramètre. Le code sera écrit dans le fichier proc_compter_triangles.sql. Afin de le tester, utilisez les commandes suivantes :

@proc_compter_triangles
@read_start_node_triangles

Scriptes d'exécution

read_start_node_fermeture.sql :

ACCEPT start_user PROMPT "Donnez un nom d'utilisateur : "
SET SERVEROUTPUT ON
SET VERIFY OFF
EXECUTE fermeture_transitive('&start_user');

read_start_node_triangles.sql :

ACCEPT start_user PROMPT "Donnez un nom d'utilisateur : "
SET SERVEROUTPUT ON
SET VERIFY OFF
EXECUTE proc_compter_triangles('&start_user');

Mandelbrot en SQL récursif

Téléchargez le fichier http://canali.web.cern.ch/canali/res/All_Files/SQL_color_Mandelbrot/Mandelbrot_SQL_Oracle_text.sql et exécutez le dans un terminal sqlplus en plein écran (@Mandelbrot_SQL_Oracle_text):

-- Mandelbrot set visualization in SQL for Oracle 
--
-- Ported to Oracle from the PostgreSQL version https://wiki.postgresql.org/wiki/Mandelbrot_set
-- Author: Luca.Canali@cern.ch, August 2015
--
-- Additional references:
-- http://thedailywtf.com/articles/Stupid-Coding-Tricks-The-TSQL-Madlebrot
-- https://en.wikipedia.org/wiki/Mandelbrot_set
-- https://www.sqlite.org/lang_with.html
-- https://community.oracle.com/message/3136057
-- http://xoph.co/20130917/mandelbrot-sql/
--  
-- Tested on Oracle (SQL*plus) 11.2.0.4 for Linux using Putty as terminal emulator
--
 
-- Oracle SQL*plus page setup and formatting parameters
SET verify off
SET LINES 250
SET pages 999
 
-- Configuration parameters for the Mandelbrot set calculation
-- Edit to change the region displayed and/or resolution by changing the definitions here below
-- Edit your terminal screen resolution and/or modify XPOINTS and YPOINTS so that the image fits the screen
define XMIN=-2.0
define YMIN=-1.4
define XMAX=0.5
define YMAX=1.4
define XPOINTS=150
define YPOINTS=80
define XSTEP="(&XMAX - &XMIN)/(&XPOINTS - 1)"
define YSTEP="(&YMAX - &YMIN)/(&YPOINTS - 1)"
 
-- Visualization parameters 
define PALETTESTRING=" .,,,-----++++%%%%@@@@#### "
define MAXITER="LENGTH('&PALETTESTRING')"
define ESCAPE_VAL=4
 
WITH
   XGEN AS (                            -- X dimension values generator
        SELECT CAST(&XMIN + &XSTEP * (rownum-1) AS binary_double) AS X, rownum AS IX FROM DUAL CONNECT BY LEVEL <= &XPOINTS),
   YGEN AS (                            -- Y dimension values generator
        SELECT CAST(&YMIN + &YSTEP * (rownum-1) AS binary_double) AS Y, rownum AS IY FROM DUAL CONNECT BY LEVEL <= &YPOINTS),
   Z(IX, IY, CX, CY, X, Y, I) AS (     -- Z point iterator. Makes use of recursive common table expression 
        SELECT IX, IY, X, Y, X, Y, 0 FROM XGEN, YGEN
        UNION ALL
        SELECT IX, IY, CX, CY, X*X - Y*Y + CX, 2*X*Y + CY, I+1 FROM Z WHERE X*X + Y*Y < &ESCAPE_VAL AND I < &MAXITER),
   MANDELBROT_MAP AS (                       -- Computes an approximated map of the Mandelbrot set
        SELECT IX, IY, MAX(I) AS VAL FROM Z  -- VAL=MAX(I) represents how quickly the values reached the escape point
        GROUP BY IY, IX)
SELECT LISTAGG(SUBSTR('&PALETTESTRING',VAL,1)) WITHIN GROUP (ORDER BY IX) GRAPH  -- LISTAGG concatenates values into rows
FROM MANDELBROT_MAP                                                              -- PALETTESTRING provides the map values 
GROUP BY IY
ORDER BY IY DESC;

© http://canali.web.cern.ch/canali/res/All_Files/SQL_color_Mandelbrot/Mandelbrot_SQL_Oracle_text.sql

site/enseignement/master/bdle/tmes/sqlrecursif.txt · Dernière modification: 19/10/2017 11:06 par hubert