Formation Apache Spark

social media concept

FORMATION APACHE SPARK : BOOSTEZ LE TRAITEMENT DE VOS DONNÉES BIG DATA

Pré-requis : connaissances Python ou Java
Pédagogie : 50% de théorie – 50% de pratique
Durée : 1 jours
Lieu : Paris ou Neuilly

OBJECTIFS DE LA FORMATION

Apache Spark est un moteur d’analyse multifonction dédié au traitement rapide de gros volumes de données et est donc naturellement orienté vers les applications Big Data. Les stagiaires découvriront comment déployer Spark pour les données d’un cluster Hadoop.

PROGRAMME DE LA FORMATION

Introduction
Origines
Spark et Hadoop
Spark et MapReduce
Études de cas

Installation de Spark
Sur machine / En cluster / Dans le Cloud /Pour Hadoop

Premiers pas
Les API de Spark : Scala, Python et Java
Spark Shell vs Spark Applications

Programmation parallèle
Mise en place d’un SparkContext
Présentation du RDD (Resilient Distributed Dataset)
Importation des données d’une base HDFS ou HBase

Gestion des flux de données
Spark Streaming
Amélioration des performances
Maintenance et monitoring

Algorithmes sous Spark
Algorithmes itératifs
Analyses graphiques
Machine Learning

Maintenance

PROCHAINES DATES DE FORMATION

Nous contacter pour obtenir les futures dates pour cette formation :
contact@openvalue.fr

REVENIR AU MENU PRINCIPAL