Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
site:enseignement:master:bdle:tmes:algebrespark-dfds [26/10/2017 16:07] amine |
site:enseignement:master:bdle:tmes:algebrespark-dfds [01/10/2018 12:47] (Version actuelle) hubert [[TME II-4] Miniprojet] |
||
---|---|---|---|
Ligne 2: | Ligne 2: | ||
- | ====== [TME II-4] Miniprojet ====== | + | ====== [TME II-4] Miniprojet 2017====== |
- | ===== Modalités ===== | + | [[http://webia.lip6.fr/~baazizi/teaching/2017/bdle-miniprojet/| Dépôt projets]] |
- | **Date de remise : ** jeudi 09-11-2017, 14h00, par envoi de mail à [[baazizi@ia-lip6.fr]], mettre en sujet [BDLE-MINIPROJ] | + | |
+ | |||
+ | |||
+ | [[https://nuage.lip6.fr/s/wNwjFKqAw9aGXHp|Dossier Projets 2018]] | ||
+ | |||
+ | /* | ||
+ | (le dossier contient le [[https://nuage.lip6.fr/s/YDyKzceJF9mZMpa|sujet des projets 2018]]) | ||
+ | */ | ||
+ | |||
+ | ===== Année 2017 ===== | ||
+ | |||
+ | === Modalités === | ||
+ | **Date de remise : ** jeudi 09-11-2017, 14h00, par envoi de mail à [[baazizi@ia.lip6.fr]] et à [[Hubert.Naacke@lip6.fr]], mettre en sujet [BDLE-MINIPROJ] | ||
**Documents à remettre :** fichier texte (word, pdf, etc) contenant les résultats de chaque question + annexe contenant le code Scala utilisé dans chaque question. | **Documents à remettre :** fichier texte (word, pdf, etc) contenant les résultats de chaque question + annexe contenant le code Scala utilisé dans chaque question. | ||
- | + | ||
==== Partie principale ==== | ==== Partie principale ==== | ||
Ligne 22: | Ligne 34: | ||
=== Statistiques sur les chemins et co-occurences === | === Statistiques sur les chemins et co-occurences === | ||
- | - Pour chaque pattern de 2 propriétés qui se suivent, calculer sa fréquence dans les données. //Exemple// Si le triple pattern (?x,influences,?y) (?y, livesIn, ?z) retourne 1000 résultats alor la fréquence du pattern (influences, livesIn) vaut 1000. | + | - Pour chaque pattern de 2 propriétés qui se suivent, calculer sa fréquence dans les données. //Exemple// Si le triple pattern (?x,influences,?y) (?y, livesIn, ?z) retourne 1000 résultats alors la fréquence du pattern (influences, livesIn) vaut 1000. |
- Encoder la fonction //cheminNoeudLongueur(noeud: string, len:entier)// qui retourne, pour le sujet //noeud//, tous les chemins démarrant de //noeud// et ayant la longueur //len//. La longueur d'un chemin est le nombre de propriétés traversées. | - Encoder la fonction //cheminNoeudLongueur(noeud: string, len:entier)// qui retourne, pour le sujet //noeud//, tous les chemins démarrant de //noeud// et ayant la longueur //len//. La longueur d'un chemin est le nombre de propriétés traversées. | ||
- | - Pour chaque paire de propriétés, donner le nombre de sujets qu'elles partagent. //Exemple// Soit le triplet pattern (x, livesIn, y) (x, citizenOf, z) qui retourne 10 résultat. Les propriétés de la paire (livesIn, citizenOf) partagent 10 sujets. | + | - Pour chaque paire de propriétés, donner le nombre de sujets qu'elles partagent. //Exemple.// Si le triple pattern (x, livesIn, y) (x, citizenOf, z) retourne 10 résultat alors les propriétés de la paire (livesIn, citizenOf) partagent 10 sujets. |
Ligne 30: | Ligne 42: | ||
**Dataset à utiliser :** DBpedia. | **Dataset à utiliser :** DBpedia. | ||
- | - Dans un premier temps, compléter les triplets de ''dbpediaShortName8M'' avec leur type qui se trouvent dans ''dbpediaShortNameTypeFor8M.txt''. | + | - Dans un premier temps, compléter les triplets de ''dbpediaShortName8M'' avec le type de leurs noeuds qui se trouvent dans ''dbpediaShortNameTypeFor8M.txt''. |
- | - Pour chaque type, retourner son //domaine//, i.e le nombre de sujets distinct ayant ce type. | + | - Combien de sujets ont aucun type, exactement un type, au moins 2 types ? 3 nombres à calculer. |
- | - Pour chaque type, retourner son //co-domaine//, i.e le nombre d'objets distinct ayant ce type. | + | - Pour chaque type, retourner le nombre de sujets distincts ayant ce type, et le nombre d'objets distincts ayant ce type. |
- | + | ||
<showif isloggedin> | <showif isloggedin> | ||
- | Initialement prévu mais non posée en 2017. | + | <fc #008000>Initialement prévu mais non posée en 2017. |
+ | </fc> | ||
+ | - Pour chaque propriété, retourner son //domaine// (la liste des types utilisés pour un sujet) et son //co-domaine// (la liste des type utilisés pour un objet). | ||
- | vérification de l'existence de cycle et extraire éventuellement des cycles | + | |
+ | Vérification de l'existence de cycle et extraire éventuellement des cycles | ||
de longueur n qui varie 2 -> 4 | de longueur n qui varie 2 -> 4 | ||
+ | |||
</showif> | </showif> |