☀️ C'est l'été chez ITTA ! Profitez de 10% de réduction jusqu'au 31 juillet sur une sélection de formations 🌴

Formation : AWS – Building Batch Data Analytics Solutions on AWS

Ref. AWS-301
Durée :
1
 jour
Examen :
Non certifiant
Niveau :
Fondamental

AWS - Building Batch Data Analytics Solutions on AWS

Concevoir des solutions d’analyse de données par lots avec AWS

L’analyse de données est devenue un pilier essentiel pour les entreprises qui cherchent à tirer parti de leurs informations pour des décisions stratégiques. La formation AWS – Building Batch Data Analytics Solutions on AWS vous permettra d’acquérir les compétences nécessaires pour concevoir des pipelines de traitement par lots sur AWS, en utilisant des services comme Amazon EMR. Vous apprendrez à exploiter Apache Spark et Apache Hadoop pour optimiser la collecte, l’ingestion et le traitement des données. Ce cours s’adresse à ceux qui veulent maîtriser les outils d’AWS tout en intégrant des pratiques de sécurité et de gestion des coûts.

Pourquoi suivre cette formation AWS – Building Batch Data Analytics Solutions on AWS ?

En suivant ce programme, vous découvrirez comment utiliser Amazon EMR pour analyser des données à grande échelle et orchestrer des solutions de traitement par lots robustes. Vous vous familiariserez avec des technologies comme Apache Hive, AWS Glue, et AWS Step Functions pour transformer et analyser vos données. La formation vous fournira des compétences pratiques et stratégiques pour optimiser vos processus, tout en assurant la sécurité des données et une gestion efficace des ressources.

Profils des participants

  • Ingénieurs de plateformes de données
  • Architectes de solutions de données
  • Responsables de pipelines analytiques
  • Opérateurs AWS spécialisés dans le Big Data

Objectifs

  • Concevoir des pipelines de données analytiques
  • Optimiser le stockage et l’ingestion des données
  • Utiliser Amazon EMR avec Apache Spark et Hive
  • Appliquer des pratiques de gestion des coûts
  • Sécuriser les clusters et les données sur AWS
  • Superviser les charges de travail analytiques
  • Automatiser le traitement des données par lots

Connaissances Préalables

  • Expérience avec Apache Spark et Apache Hadoop (minimum 1 an)
  • Notions de base en gestion de clusters et réseaux sur AWS
  • Connaissances en sécurité des données et chiffrement
  • Compréhension des concepts d’architecture de données
  • Familiarité avec les outils de surveillance et d’optimisation de performance

Contenu du cours

Module A : Vue d’ensemble de l’analyse des données et du pipeline de données

  • Cas d’utilisation de l’analyse de données
  • Utilisation du pipeline de données pour les analyses

Module 1 : Introduction à Amazon EMR

  • Utiliser Amazon EMR dans des solutions analytiques
  • Architecture des clusters Amazon EMR
  • Démo interactive : Lancement d’un cluster Amazon EMR
  • Stratégies de gestion des coûts

Module 2 : Pipeline analytique avec Amazon EMR : ingestion et stockage

  • Optimisation du stockage avec Amazon EMR
  • Techniques d’ingestion de données

Module 3 : Analyse de données par lots à haute performance avec Apache Spark sur Amazon EMR

  • Cas d’utilisation d’Apache Spark sur Amazon EMR
  • Pourquoi choisir Apache Spark sur Amazon EMR
  • Concepts de Spark
  • Démo interactive : Connexion à un cluster EMR et exécution de commandes Scala avec Spark shell
  • Transformation, traitement et analyses
  • Utilisation des notebooks avec Amazon EMR
  • Laboratoire pratique : Analyse de données à faible latence avec Apache Spark sur Amazon EMR

Module 4 : Traitement et analyse des données par lots avec Amazon EMR et Apache Hive

  • Utilisation d’Amazon EMR avec Hive pour traiter les données par lots
  • Transformation, traitement et analyses
  • Laboratoire pratique : Traitement des données par lots avec Amazon EMR et Hive
  • Introduction à Apache HBase sur Amazon EMR

Module 5 : Traitement des données sans serveur

  • Traitement, transformation et analyses de données sans serveur
  • Utilisation d’AWS Glue avec des charges de travail Amazon EMR
  • Laboratoire pratique : Orchestration du traitement des données dans Spark avec AWS Step Functions

Module 6 : Sécurisation et surveillance des clusters Amazon EMR

  • Sécurisation des clusters EMR
  • Démo interactive : Chiffrement côté client avec EMRFS
  • Surveillance et dépannage des clusters Amazon EMR
  • Démo : Revue de l’historique des clusters Apache Spark

Module 7 : Conception de solutions d’analyse de données par lots

  • Cas d’utilisation de l’analyse de données par lots
  • Activité : Conception d’un flux de travail d’analyse de données par lots

Module B : Développement d’architectures de données modernes sur AWS

  • Architectures de données modernes

Documentation

  • Support de cours numérique inclus

Cours complémentaires

Informations additionnelles

Optimiser les solutions analytiques par lots avec AWS

La formation AWS – Building Batch Data Analytics Solutions on AWS est une opportunité pour les professionnels du Big Data de maîtriser les technologies AWS, et plus particulièrement Amazon EMR, un service géré qui prend en charge Apache Spark et Apache Hadoop. Ce programme se concentre sur la création de pipelines de données robustes, capables de gérer de grandes quantités de données et de les traiter efficacement pour fournir des insights stratégiques.

Cette formation est idéale pour les ingénieurs et architectes de données souhaitant automatiser les processus d’analyse et de traitement par lots, tout en assurant la sécurité des données. Grâce à des démonstrations interactives et des laboratoires pratiques, vous apprendrez à configurer et à optimiser des clusters EMR, à utiliser des outils tels que AWS Glue et AWS Step Functions pour orchestrer vos tâches, et à appliquer des stratégies de gestion des coûts adaptées à vos besoins.

Les technologies AWS au service de l’analyse de données

L’un des points forts de ce cours est l’intégration de services open-source comme Apache Hive et HBase avec Amazon EMR. Vous explorerez également comment AWS peut simplifier et automatiser les processus de traitement des données à travers des services sans serveur, garantissant ainsi flexibilité et performance pour vos applications analytiques.

Amazon EMR, en tant que solution clé dans le traitement des données par lots, vous permet de vous concentrer sur l’analyse, tout en prenant en charge la gestion des ressources et la mise à l’échelle automatique. Vous apprendrez à tirer parti de ces fonctionnalités pour transformer vos processus et rendre vos solutions analytiques plus efficaces.

FAQ

Qu’est-ce qu’Amazon EMR ?
Amazon EMR est un service AWS géré qui facilite l’exécution de frameworks Big Data comme Apache Spark et Apache Hadoop pour traiter de grandes quantités de données.

Pourquoi utiliser AWS Glue dans cette formation ?
AWS Glue est utilisé pour orchestrer et automatiser le traitement des données dans des environnements Amazon EMR, réduisant ainsi la complexité des pipelines de données.

Est-il difficile de sécuriser un cluster Amazon EMR ?
Non, AWS propose des outils tels qu’EMRFS pour chiffrer les données côté client, ainsi que des pratiques de sécurité robustes pour protéger vos clusters.

Prix de l'inscription
CHF 850.-
Inclus dans ce cours
  • Formation dispensée par un expert du domaine
  • Documentation et supports digitaux
  • Badge de réussite
Mois actuel

Session planifiée à la demande, veuillez nous contacter pour ouvrir une session

Contact

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Horaires d’ouverture

Du lundi au vendredi

de 8h30 à 18h00

Tél. 058 307 73 00

Contactez-Nous

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Faire une demande

Opening hours

Monday to Friday
8:30 AM to 6:00 PM
Tel. 058 307 73 00

Contact-us

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Make a request