Ceci est une ancienne révision du document !
Copier dans votre espace perso puis désarchiver
/.../tpch-extrait.tgz
En étant dans tpch-extrait, créer les données dans hdfs en tapant
hadoop fs -mkdir /tpch hadoop fs -put lineitem.tbl /tpch hadoop fs -put part.tbl /tpch
puis vérifier que les fichiers existent
hadoop fs -ls /tpch
Commencer par charger les données en RDD
val tpch="/tpch/" val lineitem_t = tpch+"lineitem.tbl" val part_t = tpch+"part.tbl"