Formation Apache Spark
FORMATION APACHE SPARK : BOOSTEZ LE TRAITEMENT DE VOS DONNÉES BIG DATA
Pré-requis : connaissances Python ou Java
Pédagogie : 50% de théorie – 50% de pratique
Durée : 1 jours
Lieu : Paris ou Neuilly
OBJECTIFS DE LA FORMATION
Apache Spark est un moteur d’analyse multifonction dédié au traitement rapide de gros volumes de données et est donc naturellement orienté vers les applications Big Data. Les stagiaires découvriront comment déployer Spark pour les données d’un cluster Hadoop.
PROGRAMME DE LA FORMATION
Introduction
Origines
Spark et Hadoop
Spark et MapReduce
Études de cas
Installation de Spark
Sur machine / En cluster / Dans le Cloud /Pour Hadoop
Premiers pas
Les API de Spark : Scala, Python et Java
Spark Shell vs Spark Applications
Programmation parallèle
Mise en place d’un SparkContext
Présentation du RDD (Resilient Distributed Dataset)
Importation des données d’une base HDFS ou HBase
Gestion des flux de données
Spark Streaming
Amélioration des performances
Maintenance et monitoring
Algorithmes sous Spark
Algorithmes itératifs
Analyses graphiques
Machine Learning
Maintenance
PROCHAINES DATES DE FORMATION
Nous contacter pour obtenir les futures dates pour cette formation :
contact@openvalue.fr