Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:membres:anciens:ndiouma:start

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
site:membres:anciens:ndiouma:start [18/03/2015 10:04]
ndiouma
site:membres:anciens:ndiouma:start [02/12/2015 13:06] (Version actuelle)
amann Page déplacée de site:membres:ndiouma:start à site:membres:anciens:ndiouma:start
Ligne 1: Ligne 1:
-{{indexmenu_n>​1}}+{{indexmenu_n>​7}}
  
 ~~NOTOC~~ ~~NOTOC~~
Ligne 24: Ligne 24:
 Le phénomène du « Big Data » est de plus en plus perçu comme l’un des grands défis informatique de la décennie en cours. De nombreux domaines font face à un ‘déluge’ de données sans précédent. La quantité des données produites augmente constamment et rend leur traitement de plus en plus difficile à gérer avec les outils actuels. Le phénomène du « Big Data » est de plus en plus perçu comme l’un des grands défis informatique de la décennie en cours. De nombreux domaines font face à un ‘déluge’ de données sans précédent. La quantité des données produites augmente constamment et rend leur traitement de plus en plus difficile à gérer avec les outils actuels.
  
-L’accès, l’interrogation et l’analyse de ces nouvelles masses de données sont essentiels pour élargir les connaissances du domaine y afférent ​et et font parties des défis majeurs du Big Data. Ceci est particulièrement crucial dans des domaines tels que les média sociaux, la génomique, la climatologie,​ les réseaux énergétiques complexes, l’astronomie,​ l’écologie et la biodiversité.+L’accès, l’interrogation et l’analyse de ces nouvelles masses de données sont essentiels pour élargir les connaissances du domaine y afférent et font parties des défis majeurs du Big Data. Ceci est particulièrement crucial dans les domaines tels que les média sociaux, la génomique, la climatologie,​ les réseaux énergétiques complexes, l’astronomie,​ l’écologie et la biodiversité.
  
 La gestion de ces masses de données nécessite l’utilisation de nouveaux systèmes de gestion de données disposant de méthodes d’accès performantes et permettant d’exprimer des requêtes avec des langages de haut niveau, typiquement un langage déclaratif. (cf. les SGBD offrant un accès avec un langage de requêtes textuel standard ​ tel que sql, xquery, sparql). La gestion de ces masses de données nécessite l’utilisation de nouveaux systèmes de gestion de données disposant de méthodes d’accès performantes et permettant d’exprimer des requêtes avec des langages de haut niveau, typiquement un langage déclaratif. (cf. les SGBD offrant un accès avec un langage de requêtes textuel standard ​ tel que sql, xquery, sparql).
  
-Un aspect particulièrement difficile à prendre en compte qui est le comportement très versatile des utilisateurs. Cela génère des demandes très fluctuantes : la charge est variable en nombre de requêtes, certaines données sont plus populaires (fréquemment demandées) que d’autres, la popularité est elle-même fluctuante (une données n’est populaire que pendant une durée limitée). Or les solutions actuelles n’ont pas été conçues pour s’adapter dynamiquement à ce type de situation.+Un aspect particulièrement difficile à prendre en compte qui est le comportement très **versatile** des utilisateurs. Cela génère des demandes très fluctuantes : la charge est variable en nombre de requêtes, certaines données sont plus populaires (fréquemment demandées) que d’autres, la popularité est elle-même ​**fluctuante** (une données n’est populaire que pendant une durée limitée). Or les solutions actuelles n’ont pas été conçues pour s’adapter dynamiquement à ce type de situation.
  
-Cette thèse se déroule dans le contexte du GBIF, initiative visant à fédérer et partager les données de biodiversité produites par de nombreux fournisseurs à l’échelle mondiale. Le GBIF propose actuellement des services pour interroger les données et les visualiser [[http://​www.gbif.org/​country/​FR/​summary|Exemple]]. Toutefois, avec un nombre croissant de fournisseurs qui ajoutent de nouvelles données et d’utilisateurs qui expriment de nouveaux besoins d’interrogation,​ l’accès aux données du GBIF pose un double problème d’expressivité et d’efficacité difficile à résoudre. +Cette thèse se déroule dans le contexte du GBIF, initiative visant à fédérer et partager les données de biodiversité produites par de nombreux fournisseurs à l’échelle mondiale. Le GBIF propose actuellement des services pour interroger les données et les visualiser [[http://​www.gbif.org/​country/​FR/​summary|Exemple]]. Toutefois, avec un nombre croissant de fournisseurs qui ajoutent de nouvelles données et d’utilisateurs qui expriment de nouveaux besoins d’interrogation,​ l’accès aux données du GBIF pose un double problème d’**expressivité** et d’**efficacité** difficile à résoudre. 
-L’objectif principal de cette thèse, est de concevoir une solution qui offre un accès expressif et efficace à une très grande base de données, lorsque le nombre d’utilisateurs devient très grand. ​+//L’objectif principal// de cette thèse, est de concevoir une solution qui offre un accès expressif et efficace à une très grande base de données, lorsque le nombre d’utilisateurs devient très grand. ​
  
 Face à ce problème, nous considérons l’opportunité de mutualiser les ressources des utilisateurs pour concevoir une solution de gestion de données globale qui serait adaptée à une infrastructure de type cloud. Pour autant, cela n’est pas trivial et nécessite une coordination fine entre les utilisateurs : Face à ce problème, nous considérons l’opportunité de mutualiser les ressources des utilisateurs pour concevoir une solution de gestion de données globale qui serait adaptée à une infrastructure de type cloud. Pour autant, cela n’est pas trivial et nécessite une coordination fine entre les utilisateurs :
Ligne 45: Ligne 45:
 =====Publications=====  ​ =====Publications=====  ​
 </​WRAP> ​   </​WRAP> ​  
-<WRAP column box left 100%>  ​+
 === 2014 ===  === 2014 === 
-</​WRAP> ​ + 
-  * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Algorithmes de traitement de requêtes de biodiversité dans un environnement distribué</​fc>"//​. In Revue africaine de la recherche en informatique et mathématiques appliquées (ARIMA ​journal), volume 18, pp 1–18, 2014. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​arima14.pdf|pdf}}**</​fc>​]+  * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Algorithmes de traitement de requêtes de biodiversité dans un environnement distribué</​fc>"//​. In Revue africaine de la recherche en informatique et mathématiques appliquées (ARIMA ​Journal), volume 18, pp 1–18, 2014. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​arima14.pdf|pdf}}**</​fc>​]
  
   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. ​ //"<​fc #​4682b4>​Bigbio : Utiliser les techniques de gestion du big data pour les données de la biodiversité</​fc>"​.// ​  In 12th African Conf. on Research In Computer Science and Applied Mathematics (CARI' 14), Saint-Louis,​ Sénégal, pp 273–284, 2014. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​cari14-BigBio.pdf|pdf}}**</​fc>​]   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. ​ //"<​fc #​4682b4>​Bigbio : Utiliser les techniques de gestion du big data pour les données de la biodiversité</​fc>"​.// ​  In 12th African Conf. on Research In Computer Science and Applied Mathematics (CARI' 14), Saint-Louis,​ Sénégal, pp 273–284, 2014. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​cari14-BigBio.pdf|pdf}}**</​fc>​]
  
-  * Idrissa Sarr, HubertNaacke, ​ **Ndiouma Bame**, Ibrahima Gueye, ​ and  Samba  Ndiaye. //<fc #​4682b4>​Green ​ and distributed architecture for managing big data of biodiversity</​fc>​ (Book Chapter)//</fc>". In Computing in Research and Development in Africa : Benets, Trends, Challenges and Solutions, pp 21–39. Springer International Publishing Switzerland,​ 2014. +  * Idrissa Sarr, HubertNaacke, ​ **Ndiouma Bame**, Ibrahima Gueye, ​ and  Samba  Ndiaye. //<fc #​4682b4>​Green ​ and distributed architecture for managing big data of biodiversity</​fc>​ (Book Chapter)//"​. In Computing in Research and Development in Africa : Benets, Trends, Challenges and Solutions, pp 21–39. Springer International Publishing Switzerland,​ 2014. 
-<WRAP column box left 100%>  ​+
 === 2013 ===  === 2013 === 
-</​WRAP>  ​+
  
   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Traitement décentralisé de requêtes de  biodiversité</​fc>"//​. In 5ème édition du  Colloque National sur la Recherche en Informatique et ses Applications (CNRIA), Ziguinchor, Sénégal, pp 8, 2013. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​CNRIA13.pdf|pdf}}**</​fc>​]   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Traitement décentralisé de requêtes de  biodiversité</​fc>"//​. In 5ème édition du  Colloque National sur la Recherche en Informatique et ses Applications (CNRIA), Ziguinchor, Sénégal, pp 8, 2013. [<fc #​fa8072>​**{{:​site:​membres:​ndiouma:​CNRIA13.pdf|pdf}}**</​fc>​]
-<WRAP column box left 100%>  ​+
 ===   2012 ===  ===   2012 === 
-</​WRAP> ​   
  
   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Architecture répartie à large échelle pour le traitement parallèle de requête de biodiversité</​fc>"//​. In 11th African Conf. on Research in Computer Science and Applied Mathematics (CARI'​12),​ Algiers, Algeria, ​ pp 143–150, 2012.[<​fc #​fa8072>​**{{:​site:​membres:​ndiouma:​cari12.pdf|pdf}}**</​fc>​] ​   ​   * **Ndiouma Bame**, Hubert Naacke, Idrissa Sarr, and Samba Ndiaye. //"<​fc #​4682b4>​Architecture répartie à large échelle pour le traitement parallèle de requête de biodiversité</​fc>"//​. In 11th African Conf. on Research in Computer Science and Applied Mathematics (CARI'​12),​ Algiers, Algeria, ​ pp 143–150, 2012.[<​fc #​fa8072>​**{{:​site:​membres:​ndiouma:​cari12.pdf|pdf}}**</​fc>​] ​   ​
-    ​+ 
 + 
 +===== Quelques exemples de requêtes ===== 
 + 
 + 
 +**Exemples de requêtes <fc green>​supportées</​fc>​ par le portail du GBIF** 
 + 
 +Seules les requêtes de sélection d'​occurences sont supportées. 
 + 
 +  * Requête 1. [[http://​www.gbif.org/​occurrence/​search?​TAXON_KEY=6&​COUNTRY=FR|sélectionner les occurrences de plantes de la france]]. Le prédicat de sélection est : Country='​France'​ and ScientificName='​Plantae'​ 
 + 
 +  * Requête 2. [[http://​www.gbif.org/​occurrence/​search?​TAXON_KEY=4334&​COUNTRY=FR|sélectionner les occurrences d'​abeilles de la france]] 
 + 
 + 
 +**Exemple de requêtes <fc #​ff0000>​non-supportées</​fc>​ par le portail du GBIF** 
 + 
 +  * Requête 1. Calculer la densité des plantes par maille de pas de 1km en france 
 + 
 +  * Requête 2. Calculer la densité des abeilles par maille de pas de 1km en france 
 + 
 +  * Requête 3. Calculer la cooccurrence des plantes et des abeilles par maille de pas de 1km en france 
 + 
  
 [[http://​www.lip6.fr/​actualite/​personnes-fiche.php?​ident=D1270|Ma page au LIP6]] [[http://​www.lip6.fr/​actualite/​personnes-fiche.php?​ident=D1270|Ma page au LIP6]]
site/membres/anciens/ndiouma/start.1426669456.txt.gz · Dernière modification: 18/03/2015 10:04 par ndiouma