Formation Big Data : Les techniques d'Analyse et de Visualisation Hive, Pig, Impala, Spark, Drill, Elasticsearch, Logstash, Kibana, Dataviz

4.4 sur 5 étoiles

5 étoiles
37%
4 étoiles
62%
3 étoiles
0%
2 étoiles
0%
1 étoile
0%
Voir les 8 avis
(8 avis)
Durée 4 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence OTAV
Éligible CPF Non

L’objectif de cette formation est de vous rendre autonome dans l’analyse et la visualisation des données dans un contexte Big Data.

Un premier premier rappel permet de replacer les technologies dans le contexte du Big Data afin de clairement comprendre pourquoi de nouveaux outils apparaissent par rapport aux standards SQL ou de visualisation.

Ensuite, la progression logique de la formation vous permettra de savoir structurer vos données, les alimenter, les analyser et enfin de les visualiser avec le bon outil. On se situe ainsi dans un scénario cohérent et réaliste autour du cycle de vie des données.

Les nombreuses manipulations réalisées durant la formation vous permettront non seulement de disposer d’une vue générale très précise des différents concepts et outils, y compris sur le plan méthodologique, mais aussi d’être véritablement opérationnel sur les standards du marché tant en terme de langage que de framework de traitement de la donnée. Vous saurez également choisir le bon outil de visualisation pour restituer des présentations dynamiques sur des analyses plus ou moins complexes en communiquant de manière efficace et accessible (Dataviz, Data Storytelling).

Objectifs opérationnels :

Être autonome dans l'analyse et la visualisation des données dans un contexte Big Data.

Objectifs pédagogiques :

À l'issue de cette formation Big Data Analyse Visualisation, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre les spécificités du Big Data
  • Connaître les concepts fondamentaux et technologies associées au Big Data
  • Gérer, collecter et explorer des données
  • Analyser et visualiser ces données

Public :

Cette formation est destinée aux statisticiens, analystes de données (Data Analyst), consultants en informatique décisionnelle (BI), dataminers, développeurs, chefs de projets.

Prérequis :

Des connaissances de base sur le langage SQL, le développement et les statistiques (de niveau scolaire) sont nécessaires pour suivre ce cours.

Comprendre les spécificités du Big Data

Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique (données personnelles, CNIL, accords internationaux, etc.)

Les concepts fondamentaux et technologies associées du Big Data (stockage, recherche, visualisation)

Le concept de Datalake
L’écosystème Hadoop, quel outil pour quel usage ?
Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS
Philosophie MapReduce
Quelles différences entre les distributions pour l’analyste ?
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
La philosophie open source et les alternatives propriétaires
Python, langage phare du Big Data
Solution Cloud ou on Premise, quels impacts ?
Moteur de recherche et Big Data, quand utiliser la stack Elasticsearch, Logstash, Kibana (ELK) ?
Impacts techniques et organisationnel

Gestion des données structurées ou non

Exemples de données non structurées
Manipuler les données avec différents formats de fichiers :
HDFS
Fichiers plats : CSV, JSON
Structures optimisées : Parquet, Avro
Organisation relationnelle : Hive metastore
Le Master Data Management (MDM) pour réconcilier les référentiels
Structurer vos données avec Hive (bases, tables, etc.)

La collecte et exploration des données

Intégrer les données avec un ETL
La phase de collecte des données
Les outils dédiés à la collecte:
Utiliser Scoop pour intégrer les données depuis une base de données relationnelle
Travailler en streaming avec Kafka et Spark Streaming
Utiliser le langage Pig latin pour intégrer les données
Utiliser Spark pour la collecte et l’exploration

L’analyse des données

Analyse en contexte Big Data
Vue générale des différentes méthodes d’analyse (exploration, segmentation, classification, estimation, prédiction)
Data Science et Machine Learning:
quels rôles pour quels usages ?
phase d’un projet de Data Science
domaines d’application
Interagir avec Hadoop en temps réel (traitement parallèle avec Impala, interroger les données Hive avec Spark)
Les frameworks orientés « analyse de données »

La visualisation des données (Dataviz)

Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Exemple de visualisations avec les standards du marché (Tableau, Power BI)
Savoir communiquer sur les analyses de données (Data Storytelling)

Ce stage est illustré par diverses études de cas permettant de une pratique concrete des différentes phases de la chaine globale de traitement des données et pas seulement sur la partie analyse. TP introductif les base de Python, gestion et exploration de données avec Hive, l’ETL et le traitement des données avec Pig ou Spark, analyse et visualisation de données avec Python, Analyse et visualisation de logs avec l’Elastic stack (ELK).

Il est possible de suivre cette formation Big Data à distance. Vous participez en temps réel à la même session en même temps que les autres participants présents eux en salle de cours. Un kit spécial formation à distance vous sera envoyé avec notamment le matériel (casque micro). Vous n’avez besoin que d’un navigateur et d’une connexion internet pour suivre dans les meilleures conditions ce cours à distance Big Data. Contactez-nous pour plus d’informations sur cette formation en direct de chez vous ou depuis votre bureau.

Date de mise à jour du programme : 30/11/2022

Dates et lieux

1
2
Du 23 au 26 avril 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 23 au 26 avril 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 28 au 31 mai 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 28 au 31 mai 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 25 au 28 juin 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 25 au 28 juin 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 30 juillet au 02 août 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 30 juillet au 02 août 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
Du 24 au 27 septembre 2024
Lieu
Distanciel
Durée
4 jrs
2390 € HT
Du 24 au 27 septembre 2024
Lieu
Paris
Durée
4 jrs
2390 € HT
1
2

Logo partenaire action collective de l'OPCO Atlas Votre formation Big Data prise en charge jusqu'à 100% des coûts pédagogiques ! *

Depuis 2017, Atlas (ex-Fafiec) a sélectionné PLB Consultant pour vous proposer les meilleures formations autour du Big Data.
-  Sessions inter-entreprise sur Paris, Lyon et Lille.
-  Sessions intra-entreprise sur toute la France.

* jusqu'à 100% des coûts pédagogiques selon votre branche d'activité dans la limite des fonds mutualisés dédiés aux actions collectives et en application des critères de prise en charge en vigueur (cf conditions détaillées sur le site d'Atlas)

Avis des participants à la formation Big Data : Les techniques d'Analyse et de Visualisation

Note moyenne de 4.4/5(8)

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.

CLERC-GHERARDI Arthur
4/5

Mon avis sur le contenu du stage :

"Baignant dans le technique, j'aurai aimé des exercices plus compliqués techniquement ! Je comprends tout à fait que ça ne soit pas le cas avec des participants pouvant ne pas être technique du tout :) Un peu de Spark aurait pu être cool"

Mon avis sur le formateur :

"Peut-être essayer de faire participer un peu plus les participants, mais j'avoue que pas grand monde semblait répondant pendant le formation. Je suis déjà tombé sur des groupes plus animés ! Manques de quelques explications dans les TPs, sur PIG par exemple, il fallait avoir la doc à côté (ce qui ne me gêne pas vraiment)."

Mon avis sur la salle de formation :

"La formation à distance s'est très bien déroulée malgré mon appréhension (de la distance). Différents sujets abordés techniques comme un peu moins (visu). "

GM
5/5

Mon avis sur le contenu du stage :

"Nous avons vu le programme annoncé, ça correspondait à mes attentes"

Mon avis sur le formateur :

"J'ai beaucoup apprécié l'intervenant, Maxime, qui a su s'adapter à nos niveaux et rendre accessible un domaine très vaste et parfois encore un peu abstrait. J'ai également apprécié que l'on accorde un peu de temps à réfléchir ensemble à des problématiques bigdata que nous rencontrons dans nos entreprises respectives, c'était très intéressant."

Ce que j'ai le plus apprécié :

"Le stylo clef usb avec le cours dessus : super idée :)"

CJ
5/5

Mon avis sur le contenu du stage :

"Je trouve toujours plus pertinent de travailler sur des cas concrets auxquels nous sommes exposés dans notre entreprise que d'utiliser des exemple. Ceci dit les exemples fournis dans les supports sont de bonnes qualités."

Ce que j'ai le plus apprécié :

"La salle de pause est vraiment au top. La gratuité du café et autres est au top, FÉLICITATIONS"

Ce que j'ai le moins apprécié :

"Aucun… Manière de ne pas laisser la case vide, le robinet qui ne se coupe pas tout seul ;-) mais l'information à ce sujet passe bien."

DA
5/5

Mon avis sur le contenu du stage :

"Très instructif!"

Mon avis sur le formateur :

"Bon pédagogue, laisse le temps d'explorer lors des TP."

Ce que j'ai le plus apprécié :

"L'exploration lors des TP, les petites anecdotes et cas d'usages possibles."

Ce que j'ai le moins apprécié :

"RAS"

LJ
4/5

Mon avis sur le contenu du stage :

"Trop de commentaire de code au lieu de coder réellement, mais je peux comprendre qu'il soit difficile en termes de temps de faire autrement."

Mon avis sur le formateur :

"Formateur compétent, agréable, impliqué et sérieux."

PA
4/5

Mon avis sur le contenu du stage :

"Bon aperçu de toute la chaine de traitement, de l'acquisition à la visualisation"

Mon avis sur le formateur :

"Intervenant très pédagogue et prenant le temps d'éclaircir les points complexes"

BP
4/5

Mon avis sur le formateur :

"Très bon formateur, à l'écoute et très pédagogue"

EL HILA Mohammed
4/5

Mon avis sur le formateur :

"Merci beaucoup"


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB