Bases de Données / Databases

Site Web de l'équipe BD du LIP6 / LIP6 DB Web Site

Outils pour utilisateurs

Outils du site


site:enseignement:master:bdle:tmes:projet2020

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
site:enseignement:master:bdle:tmes:projet2020 [07/12/2020 19:21]
amine [Modalités]
site:enseignement:master:bdle:tmes:projet2020 [14/12/2020 09:47] (Version actuelle)
amine [Modalités]
Ligne 38: Ligne 38:
 Rendre ​   Rendre ​  
  
-  - Liste numérotéeun ​document pdf avec lien vers un **notebook** Databricks contenant **code source** et **informations** décrites ci-haut+  - un document pdf avec lien vers un **notebook** Databricks contenant **code source** et **informations** décrites ci-haut
   - un document HTML obtenu en exportant votre **notebook**   - un document HTML obtenu en exportant votre **notebook**
  
-Date de remise : à partir du **10-12-2020** jusqu'​au **20-12-2020 23h59** sur **Moodle**+Date de remise : à partir du **10-12-2020** jusqu'​au **20-12-2020 23h59** sur  
 +[[https://​moodle-sciences.upmc.fr/​moodle-2020/​course/​view.php?​id=3209|Moodle]]
  
- +Le sujet traité est la réalisation d’un pipeline ML pour entrainer un arbre de décision pour la *régression* à l’aide de l'API Spark ML décrite en cours, ​Le langage utilisé est **Scala**.
-Le sujet traité est la réalisation d’un pipeline ML pour entrainer un arbre de décision pour la *régression* à l’aide de l'API Spark ML décrite en cours,+
 L'​objectif principal ​ est d'​être confronté à des problématiques réelles rencontrées lorsqu'​on traite des données "​brutes"​. L'​objectif principal ​ est d'​être confronté à des problématiques réelles rencontrées lorsqu'​on traite des données "​brutes"​.
 Vous être libre d'​utiliser le dataset de votre choix dont la taille sera entre 10 MB et 50 MB. Vous être libre d'​utiliser le dataset de votre choix dont la taille sera entre 10 MB et 50 MB.
Ligne 66: Ligne 66:
 A titre d'​exemple,​ pour un dataset avec des attributs timestamps, envisager une opération roll-up vers le mois ou l'​année. A titre d'​exemple,​ pour un dataset avec des attributs timestamps, envisager une opération roll-up vers le mois ou l'​année.
  
-Construire une paire 30%-70%de jeux de test et d'​entrainement. ​+Construire une paire 30%-70% de jeux de test et d'​entrainement. ​
  
 Lancer l'​entrainement de l'​arbre de décision puis afficher ses paramètres. Lancer l'​entrainement de l'​arbre de décision puis afficher ses paramètres.
site/enseignement/master/bdle/tmes/projet2020.1607365291.txt.gz · Dernière modification: 07/12/2020 19:21 par amine