Date de remise : jeudi 09-11-2017, 14h00, par envoi de mail à baazizi@ia.lip6.fr et à Hubert.Naacke@lip6.fr, mettre en sujet [BDLE-MINIPROJ]
Documents à remettre : fichier texte (word, pdf, etc) contenant les résultats de chaque question + annexe contenant le code Scala utilisé dans chaque question.
Dataset à utiliser : DBpedia.
Dans un premier temps, compléter les triplets de dbpediaShortName8M
avec le type de leurs noeuds qui se trouvent dans dbpediaShortNameTypeFor8M.txt
.
Combien de sujets ont aucun type, exactement un type, au moins 2 types ? 3 nombres à calculer.
Pour chaque type, retourner le nombre de sujets distincts ayant ce type, et le nombre d'objets distincts ayant ce type.
Initialement prévu mais non posée en 2017.
Pour chaque propriété, retourner son domaine (la liste des types utilisés pour un sujet) et son co-domaine (la liste des type utilisés pour un objet).
Vérification de l'existence de cycle et extraire éventuellement des cycles
de longueur n qui varie 2 → 4