Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:offres:2019:stages:epique2019

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
site:offres:2019:stages:epique2019 [06/12/2018 19:12]
amann
site:offres:2019:stages:epique2019 [02/12/2019 11:25] (Version actuelle)
amann créée
Ligne 1: Ligne 1:
-====== ​Stage M2 - Evolution temporelle des domaines scientifiques ======+====== Evolution temporelle des domaines scientifiques ====== 
 +  
 +===== Stage M2 =====
  
 ==== Contacts ==== ==== Contacts ====
Ligne 9: Ligne 11:
  
 L’analyse thématique de corpus scientifiques permet de mieux comprendre les avancées effectuées dans les différents domaines de la science [1]. Au fil des années et des découvertes,​ les domaines scientifiques évoluent progressivement. Certains sujets prennent de l’ampleur dans un domaine jusqu’à devenir un domaine à part entière. Inversement d’autres sujets peuvent être délaissés dans certains domaines. Analyser la façon dont les domaines scientifiques se forment et évoluent dans un corpus qui rassemble des articles scientifiques sur plusieurs années ou décennies (comme par exemple HAL, arXiv ou Web of Science) permet aux historiens et philosophes de valider leurs modèles d’évolution de la science, aux scientifiques de mieux positionner leurs contributions dans le contexte historique, aux financeur de mieux prédire des évolutions technologiques etc… L’analyse thématique de corpus scientifiques permet de mieux comprendre les avancées effectuées dans les différents domaines de la science [1]. Au fil des années et des découvertes,​ les domaines scientifiques évoluent progressivement. Certains sujets prennent de l’ampleur dans un domaine jusqu’à devenir un domaine à part entière. Inversement d’autres sujets peuvent être délaissés dans certains domaines. Analyser la façon dont les domaines scientifiques se forment et évoluent dans un corpus qui rassemble des articles scientifiques sur plusieurs années ou décennies (comme par exemple HAL, arXiv ou Web of Science) permet aux historiens et philosophes de valider leurs modèles d’évolution de la science, aux scientifiques de mieux positionner leurs contributions dans le contexte historique, aux financeur de mieux prédire des évolutions technologiques etc…
-Par exemple, on peut se poser les questions suivantes pour mieux comprendre l’engouement autour de l’IA : Est-ce que l’IA est la même aujourd’hui que dans les années 2000 ? En quoi est-elle différente ou similaire ?  Quels sont les domaines se rapportant à l’IA ?  Est-ce que l’IA est une thématique transversale à plusieurs domaines ou plutôt au cœur de certains domaines ?+Par exemple, on peut se poser les questions suivantes pour mieux comprendre l’engouement autour de l’IA : Est-ce que l’IA est la même aujourd’hui que dans les années 2000 ? En quoi est-elle différente ou similaire ?  Quels sont les domaines se rapportant à l’IA ?  Est-ce que l’IA est une thématique transversale à plusieurs domaines ou plutôt au cœur de certains domaines ?
  
 ==== Objectifs ​ ==== ==== Objectifs ​ ====
-Ce stage s’appuie sur le workflow EPIQUE [2] d’analyse de grands corpus de documents scientifiques en cours de réalisation au laboratoire LIP6. Le workflow EPIQUE est implanté en Scala avec la plate-forme SPARK et utilise la méthode LDA pour représenter un domaine scientifique (topic) sous forme d’un ensemble de termes pondérées. Les 3 étapes du workflow permettant d’extraire l’évolution des domaines ​sont +Ce stage s’appuie sur le workflow EPIQUE [2] d’analyse de grands corpus de documents scientifiques en cours de réalisation au laboratoire LIP6. Le workflow EPIQUE est implanté en Scala avec la plate-forme SPARK et utilise la méthode LDA pour représenter un domaine scientifique (topic) sous forme d’un ensemble de termes pondérées. Les 3 étapes du workflow permettant d’extraire l’évolution des domaines ​sont 
   - découper le corpus entier en plusieurs tranches en déplaçant une fenêtre temporelle, ​   - découper le corpus entier en plusieurs tranches en déplaçant une fenêtre temporelle, ​
   - appliquer la méthode LDA pour extraire les domaines scientifiques dans chaque tranche de temps. Les domaines ainsi produits sont appelés une époque scientifique, ​   - appliquer la méthode LDA pour extraire les domaines scientifiques dans chaque tranche de temps. Les domaines ainsi produits sont appelés une époque scientifique, ​
   - comparer les époques pour déterminer dans quelle mesure elles évoluent dans le temps.   - comparer les époques pour déterminer dans quelle mesure elles évoluent dans le temps.
-Seules les étapes (1) et (2) étant déjà réalisées,​ le stage a pour objectif de concevoir et réaliser l’étape (3). Cela soulève plusieurs questions : comment représenter l’évolution des époques ? Comment mesurer la qualité des résultats ? Comment augmenter les performances ?+Seules les étapes (1) et (2) étant déjà réalisées,​ le stage a pour objectif de concevoir et réaliser l’étape ​(3). Cela soulève plusieurs questions : comment représenter l’évolution des époques ​? Comment mesurer la qualité des résultats ​? Comment augmenter les performances ​?
  
-==== Travail à réaliser : ====+==== Travail à réaliser ​: ====
    
   * Etat de l’art sur les modèles d’analyse sémantique et temporelle de contenus documentaires,​   * Etat de l’art sur les modèles d’analyse sémantique et temporelle de contenus documentaires,​
Ligne 27: Ligne 29:
   * optimisation du workflow EPIQUE.   * optimisation du workflow EPIQUE.
  
-==== Résultats ​attendus : ====+==== Résultats ​attendus ​: ====
    
   * Le workflow EPIQUE complété   * Le workflow EPIQUE complété
   * un article scientifique (en collaboration avec un doctorant en 2ème année de thèse).   * un article scientifique (en collaboration avec un doctorant en 2ème année de thèse).
  
-==== Autres ​informations : ====+==== Autres ​informations ​: ====
    
-  * Rémunération : autour de 590€ / mois +  * Rémunération ​: autour de 590€ / mois 
-  * Lieu de travail : équipe BD du LIP6+  * Lieu de travail ​: équipe BD du LIP6
  
 ==== Références bibliographiques:​ ==== ==== Références bibliographiques:​ ====
site/offres/2019/stages/epique2019.1544119954.txt.gz · Dernière modification: 06/12/2018 19:12 par amann