Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:tmes:algebrespark-dfds

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
site:enseignement:master:bdle:tmes:algebrespark-dfds [26/10/2017 16:07]
amine
site:enseignement:master:bdle:tmes:algebrespark-dfds [01/10/2018 12:47] (Version actuelle)
hubert [[TME II-4] Miniprojet]
Ligne 2: Ligne 2:
  
  
-====== [TME II-4] Miniprojet ======+====== [TME II-4] Miniprojet ​2017======
  
-===== Modalités ​===== +[[http://​webia.lip6.fr/​~baazizi/​teaching/​2017/​bdle-miniprojet/​| Dépôt projets]]  
-**Date de remise : ** jeudi 09-11-2017, 14h00, par envoi de mail à [[baazizi@ia-lip6.fr]], mettre en sujet [BDLE-MINIPROJ]+ 
 + 
 + 
 +[[https://​nuage.lip6.fr/​s/​wNwjFKqAw9aGXHp|Dossier Projets 2018]]  
 + 
 +/* 
 +(le dossier contient le [[https://​nuage.lip6.fr/​s/​YDyKzceJF9mZMpa|sujet des projets 2018]]) 
 +*/ 
 + 
 +===== Année 2017 ===== 
 + 
 +=== Modalités ​=== 
 +**Date de remise : ** jeudi 09-11-2017, 14h00, par envoi de mail à [[baazizi@ia.lip6.fr]] et à [[Hubert.Naacke@lip6.fr]], mettre en sujet [BDLE-MINIPROJ]
  
 **Documents à remettre :** fichier texte (word, pdf, etc) contenant les résultats de chaque question +  annexe contenant le code Scala utilisé dans chaque question. **Documents à remettre :** fichier texte (word, pdf, etc) contenant les résultats de chaque question +  annexe contenant le code Scala utilisé dans chaque question.
- +
  
 ==== Partie principale ==== ==== Partie principale ====
Ligne 22: Ligne 34:
  
 === Statistiques sur les chemins et co-occurences === === Statistiques sur les chemins et co-occurences ===
-  - Pour chaque pattern de 2 propriétés qui se suivent, calculer sa fréquence dans les données. //Exemple// Si le triple pattern (?​x,​influences,?​y) (?y, livesIn, ?z) retourne 1000 résultats ​alor la  fréquence du pattern (influences,​ livesIn) vaut 1000.+  - Pour chaque pattern de 2 propriétés qui se suivent, calculer sa fréquence dans les données. //Exemple// Si le triple pattern (?​x,​influences,?​y) (?y, livesIn, ?z) retourne 1000 résultats ​alors la fréquence du pattern (influences,​ livesIn) vaut 1000.
   - Encoder la fonction //​cheminNoeudLongueur(noeud:​ string, len:​entier)//​ qui retourne, pour le sujet //noeud//, tous les chemins démarrant de //noeud// et ayant la longueur //len//. La longueur d'un chemin est le nombre de propriétés traversées.   - Encoder la fonction //​cheminNoeudLongueur(noeud:​ string, len:​entier)//​ qui retourne, pour le sujet //noeud//, tous les chemins démarrant de //noeud// et ayant la longueur //len//. La longueur d'un chemin est le nombre de propriétés traversées.
-  - Pour chaque paire de propriétés,​ donner le nombre de sujets qu'​elles partagent. //​Exemple// ​Soit le triplet ​pattern (x, livesIn, y) (x, citizenOf, z) qui retourne 10 résultat. Les propriétés de la paire (livesIn, citizenOf) partagent 10 sujets.+  - Pour chaque paire de propriétés,​ donner le nombre de sujets qu'​elles partagent. //Exemple.// Si le triple ​pattern (x, livesIn, y) (x, citizenOf, z)  retourne 10 résultat ​alors les propriétés de la paire (livesIn, citizenOf) partagent 10 sujets.
  
  
Ligne 30: Ligne 42:
 **Dataset à utiliser :** DBpedia. **Dataset à utiliser :** DBpedia.
  
-  - Dans un premier temps, compléter les triplets de ''​dbpediaShortName8M''​ avec leur type qui se trouvent dans ''​dbpediaShortNameTypeFor8M.txt''​. +  - Dans un premier temps, compléter les triplets de ''​dbpediaShortName8M''​ avec le type de leurs noeuds ​qui se trouvent dans ''​dbpediaShortNameTypeFor8M.txt''​
-  - Pour chaque type, retourner ​son //​domaine//,​ i.e le nombre de sujets ​distinct ​ayant ce type.  +  - Combien de sujets ont aucun type, exactement un type, au moins 2 types ? 3 nombres à calculer
-  - Pour chaque ​type, retourner son //​co-domaine//, ​ i.e le nombre d'​objets ​distinct ​ayant ce type. +  - Pour chaque type, retourner le nombre de sujets ​distincts ​ayant ce type, et le nombre d'​objets ​distincts ​ayant ce type. 
- +  
  
  
 <showif isloggedin>​ <showif isloggedin>​
-Initialement prévu mais non posée en 2017. +<fc #008000>Initialement prévu mais non posée en 2017.  
 +</​fc>​ 
 +  - Pour chaque propriété,​ retourner son //domaine// (la liste des types utilisés pour un sujet) et son //​co-domaine//​ (la liste des type utilisés pour un objet).
  
-vérification ​de l'​existence de cycle et extraire éventuellement des cycles+ 
 +Vérification ​de l'​existence de cycle et extraire éventuellement des cycles
 de longueur n qui varie 2 -> 4 de longueur n qui varie 2 -> 4
 +
 </​showif>​ </​showif>​
site/enseignement/master/bdle/tmes/algebrespark-dfds.1509026843.txt.gz · Dernière modification: 26/10/2017 16:07 par amine