Formation Big Data : Développement d'applications et Data Visualisation Hadoop, MapReduce, Spark, Machine Learning, R, Python, Dataviz

4.6 sur 5 étoiles

5 étoiles
57%
4 étoiles
42%
3 étoiles
0%
2 étoiles
0%
1 étoile
0%
Voir les 7 avis
(7 avis)
Durée 4 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence ODAB
Éligible CPF Non

Cette formation Big Data Développement vous présente les principales technologies concernant le développement d’applications Big Data. Elle forme un ensemble cohérent dans la mesure où, dans un premier temps, elle replace le cadre global du Big Data et se conclut par la visualisation des données que les programmes développés avec les technologies présentées dans cette formation sont capables d’extraire.

Nous n’avons volontairement pas fait le choix d’un langage particulier. En effet, qu’il s’agisse de MapReduce, Spark ou du Machine Learning, la philosophie est précisément d’être indépendant du langage. Cependant, afin d’être concret et de valider le discours théorique, les exemples seront exposés en Java, Python, Scala ou R.

Objectif opérationnel :

Être capable de développer des applications pour le Big Data et savoir exploiter les données qui en découlent.

Objectifs pédagogiques :

À l'issue de cette formation Big Data Développement, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Connaître les spécificités du Big Data
  • Savoir mettre en Å“uvre les technologies relatives au Big Data
  • Comprendre et exploiter le Machine Learning
  • Pouvoir tirer partie de la visualisation des données

Public :

Ce cours s'adresse aux développeurs ainsi qu'aux chefs de projets.

Prérequis :

La connaissance d’un langage de programmation est impérative.
Les exemples seront présentés avec les langages suivants : Java, Python, Scala et R.

Comprendre les spécificités du Big Data

Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT, etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique

Les technologies Big Data (Hadoop)

Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS (Hadopp Filesystem)
Philosophie de MapReduce
L’apport de YARN (Yet Another Resource Negotiator)
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
Indexer et rechercher des données avec Elasticsearch
Les visualiser à l’aide de KIBANA
Quand utiliser le couplage Elasticsearch, Logstash, Kibana (ELK) ?
Le moteur de recherche SolR
SAS VA et autres solutions mixtes Cloud/On Premice pour explorer vos données
IBM Watson (fédération des informations)
Solution BI Classique
Impacts techniques et financiers des différentes solutions (savoir-faire, coûts, etc.)

Le développement (Mapreduce, Spark)

Philosophie et contraintes du pattern MapReduce (Hadoop)
Concrètement quelles briques logicielles pour le développeur ?
Exemple de pseudo-code pour les opérations map et reduce
Limites de MapReduce et émergence de Spark
Les différentes versions de Spark (Scala, Python et Java)
Des traitements en mémoire et tolérants aux pannes RDD (Resilient Distributed Datasets)
Les modes de travail en cluster de Spark
Exemples :
- Développement d’un wordcount avec MapReduce Spark dans différents langages (Java, Python, Scala, R)
- Calcul d’une jointure sur deux grandes tables

Machine Learning

Qu’est-ce que le Machine Learning ?
Les points de vigilance par rapport au Big Data
Les différents types de machine learning
Les principaux algorithmes
Utiliser SparkML pour faire du Machine Learning de manière distribuée
Créer un système de catégorisation
Comprendre la différence entre Deep Learning et Machine Learning
Réseaux de neurones et Deep Learning
Utiliser le deep learning pour faire de la reconnaissance de caractère avec Tensorflow en Python

La visualisation des données (Dataviz)

Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Savoir communiquer sur les analyses de données (Data Storytelling)

Études de cas

Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
Classification de conducteur dans une agence de transport
Proposition de produits par rapport à une liste d’achats (Machine Learning)

Des études de cas illustrent cette formation sur les sujets suivants :

- Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
- Classification de conducteur dans une agence de transport
- Proposition de produits par rapport à une liste d’achats (Machine Learning)

De nombreux travaux pratiques courts viennent en complément de ceux réalisés sur l’étude de cas.

Date de mise à jour du programme : 05/04/2024

Dates et lieux

Du 17 au 20 juin 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 17 au 20 juin 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 16 au 19 septembre 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 16 au 19 septembre 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 14 au 17 octobre 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 14 au 17 octobre 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 10 au 13 décembre 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 10 au 13 décembre 2024
Lieu
Paris
Durée
4 jrs
2390 € HT

Avis des participants à la formation Big Data : Développement d'applications et Data Visualisation

Note moyenne de 4.6/5(7)

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.

NGUYEN François
5/5

Mon avis sur le contenu du stage :

"Cours qui balaye l'ensemble du BigData avec des exemples concrets et des cas pratiques (présentation et utilisation d'outil concret) "

Mon avis sur le formateur :

"Formateur très compétent, qui a su répondre aux questions. Formateur très pédagogue, qui a également su vulgariser les termes techniques. "

Mon avis sur la salle de formation :

"Etant à l'extérieur, il m'est difficile de juger concrètement les salles. L'accueil par François et Maxime a été super !"

Ce que j'ai le plus apprécié :

"Bonne qualité de son, et dans le cas de soucis technique, Maxime a été très réactif."

Ce que j'ai le moins apprécié :

"Quelques exercices sur papier. Il faudrait prévoir des exercices sur d'autre support tel que des drives par exemple. "

GACHET Rudy
4/5

Mon avis sur le contenu du stage :

"Les gros plus de la formation sont la compétence et la richesse des expériences d'Olivier. Les concepts sont imagés d'exemples souvent issus d'expériences vécues ce qui est très important pour apprécier correctement à quoi répond ou ne répond pas la problématique bigdata et les pièges à éviter. Les concepts et algorithmes de la partie Machine Learning sont ceux que j'ai le plus apprécié. Le point négatif pour moi est la partie pratique, il aurait ete préférable de disposer d'un accès à une sandbox pour tout les participants afin de pratiquer davantage... Mais ce n'était peut-être pas le but premier de cette introduction au bigdata."

Mon avis sur la salle de formation :

"Salles petites"

PJC
5/5

Mon avis sur le contenu du stage :

"Malgré un manque de ma part sur les pré-requis techniques, formation très intéressante et complexe qui m'a permis de me plonger dans ce domaine (culture générale, vision technique nécessaire, bonnes pratiques)"

Mon avis sur le formateur :

"parfaite connaissance du sujet, animateur professionnel du domaine, et très bonne maîtrise des techniques pédagogiques"

Mon avis sur la salle de formation :

"A distance, quelques lags avec Adobe Connect"

RM
5/5

Mon avis sur le contenu du stage :

"travaux pratiques consistants qui permettent d'assimiler les bases du développement d'applications bigData"

Mon avis sur le formateur :

"personnel aimable et professionnel"

Ce que j'ai le plus apprécié :

"Très bonne qualité de formation, personnel professionnel"

Ce que j'ai le moins apprécié :

"Cuisine mal équipée"

AKHRAZ Ahmed
5/5

Mon avis sur le formateur :

"J'ai beaucoup apprécié le formateur qui répond à toutes les questions."

Mon avis sur la salle de formation :

"Possibilité d'avoir des encas moins caloriques/industrielle"

Ce que j'ai le plus apprécié :

"PC a disposition"

AMA
4/5

Mon avis sur le contenu du stage :

"J'aurais aimé avoir plus de pratique dans la partie machine learning."

Ce que j'ai le plus apprécié :

"L'environnement bien préparé et prêt pour les travaux pratiques."

OLIVEIRA Joel
4/5

Mon avis sur le contenu du stage :

"De nombreuses questions ont été abordées et je pense que le matériel d'appui devrait être plus organisé pour faciliter la recherche et l'accès."


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB