Journées Maestro -2016 - Sciencesconf.org

maestro-2016 : Journées Maestro -2016

Journées Masse de données en Astrophysique

5-6 juil. 2016 Toulouse (France)

sciencesconf.org:maestro-2016:115746

Utilisation d'une plateforme Hadoop/Spark pour des données astrophysiques

Christian Arnault 1, *, @

1 : Laboratoire de l'Accélérateur Linéaire (LAL) - Site web

CNRS : UMR8607, IN2P3, Université Paris XI - Paris Sud

Centre Scientifique d'Orsay B.P. 34 91898 ORSAY Cedex - France

* : Auteur correspondant

Une expérimentation est menée dans l'environnement VirtualData/OpenStack au LAL. Plusieurs caractéristiques de cette technologie sont en cours d'évaluation:

mise en place d'une infrastructure Hadoop/Spark/scipy sur une cloud OpenStack
mesures de performance (configuration du cluster, suivi des facteurs d'échelle)
apprentissage des modules fonctionnels de la plateforme Spark (Scala, Python)
exploitation des données binaires structurées dans Spark à travers le module Hadoop/avro
application aux fichiers FITS
quelques exemples de cas d'usage dans le contexte de l'expérience LSST

Christian Arnault

Axel Chevarin

Réza Ansari

Johann Cohen Tanoudji

Type :	:	oral
Thématiques	:	Astrophysique et big data
Thématiques	:	Méthodes / cas d'usage
PDF version	:	PDF version

Présentation

Personnes connectées : 1

Flux RSS