☀️ C'est l'été chez ITTA ! Profitez de 10% de réduction jusqu'au 31 juillet sur une sélection de formations 🌴
☀️ C'est l'été chez ITTA ! Profitez de 10% de réduction jusqu'au 31 juillet sur une sélection de formations 🌴 ×

Formation : Data Engineering on Microsoft Azure (DP-203)

Ref. DP-203T00
Durée :
4
 jours
Examen :
Optionnel
Niveau :
Intermédiaire

Data Engineering on Microsoft Azure (DP-203)

Ce cours Data Engineering on Microsoft Azure (DP-203) vous permettra de découvrir les modèles et les pratiques d’ingénierie des données dans le cadre de solutions analytiques en temps réel et par lots utilisant les technologies de la plate-forme de données Azure.

Vous découvrirez les technologies de calcul et de stockage de base qui sont utilisées pour construire une solution analytique, et explorerez ensuite comment concevoir des couches de service analytiques et se concentrer sur les considérations d’ingénierie des données pour travailler avec des fichiers sources.

Vous apprendrez à travers ce cours Data Engineering on Microsoft Azure, à explorer de manière interactive les données stockées dans des fichiers dans un lac de données, les différentes techniques d’ingestion qui peuvent être utilisées pour charger des données à l’aide de la fonctionnalité Apache Spark présente dans Azure Synapse Analytics ou Azure Databricks, ou comment ingérer à l’aide d’Azure Data Factory ou des pipelines Azure Synapse.

Vous aborderez également les différentes façons de transformer les données à l’aide des mêmes technologies que celles utilisées pour l’acquisition des données et apprendront à surveiller et à analyser les performances des systèmes analytiques afin d’optimiser les performances des charges de données ou des requêtes émises sur les systèmes. Enfin, vous comprendrez l’importance de la mise en œuvre de la sécurité pour garantir la protection des données au repos ou en transit.

Profils des participants

  • Les professionnels des données, architectes de données et professionnels BI qui souhaitent en savoir plus sur l’ingénierie des données et la création de solutions analytiques à l’aide des technologies de plate-forme de données existantes sur Microsoft Azure
  • Les analystes de données et data scientists qui travaillent avec des solutions analytiques basées sur Microsoft Azure

Objectifs

  • Explorer les options de calcul et de stockage pour les charges de travail d’ingénierie des données dans Azure
  • Concevoir et implémenter la couche de service
  • Comprendre les considérations liées à l’ingénierie des données
  • Exécuter des requêtes interactives à l’aide de pools SQL sans serveur
  • Explorer, transformez et chargez les données dans l’entrepôt de données à l’aide d’Apache Spark
  • Effectuer l’exploration et la transformation de données dans Azure Databricks
  • Ingérer et charger des données dans l’entrepôt de données
  • Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Intégrer les données des ordinateurs portables à Azure Data Factory ou Azure Synapse Pipelines
  • Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse
  • Analyser et optimiser le stockage des entrepôts de données
  • Supporter Hybrid Transactional Analytical Processing (HTAP) avec Azure Synapse Link
  • Effectuer la sécurité de bout en bout avec Azure Synapse Analytics
  • Effectuer le traitement en temps réel des flux avec Stream Analytics
  • Créer une solution de traitement de flux avec des hubs d’événements et des databricks Azure
  • Créer des rapports à l’aide de l’intégration Power BI avec Azure Synpase Analytics
  • Effectuer des processus intégrés d’apprentissage automatique dans Azure Synapse Analytics

Connaissances Préalables

Contenu du cours

Module 1 : Explorez les options de calcul et de stockage pour les charges de travail en ingénierie des données

  • Leçon 1 : Introduction à Azure Synapse Analytics
  • Leçon 2 : Décrire Azure Databricks
  • Leçon 3 : Introduction au stockage Azure Data Lake
  • Leçon 4 : Décrire l’architecture du lac Delta
  • Leçon 5 : Travaillez avec les flux de données en utilisant Azure Stream Analytics

Module 2 : Concevoir et implémenter la couche de service

  • Leçon 1 : Concevoir un schéma multidimensionnel pour optimiser les charges de travail analytiques
  • Leçon 2 : Transformation sans code à grande échelle avec Azure Data Factory
  • Leçon 3 : Peuplez les dimensions changeantes lentement dans les pipelines Azure Synapse Analytics

Module 3 : Considérations d’ingénierie des données pour les fichiers sources

  • Leçon 1 : Concevoir un entrepôt de données moderne à l’aide d’Azure Synapse Analytics
  • Leçon 2 : Sécuriser un entrepôt de données dans Azure Synapse Analytics

Module 4 : Exécutez des requêtes interactives à l’aide des pools SQL sans serveur Azure Synapse Analytics

  • Leçon 1 : Explorer les fonctionnalités de pools SQL sans serveur Azure Synapse
  • Leçon 2 : Données de requête dans le lac à l’aide des pools SQL sans serveur Azure Synapse
  • Leçon 3 : Créer des objets de métadonnées dans les pools SQL sans serveur Azure Synapse
  • Leçon 4 : Sécuriser les données et gérer les utilisateurs dans les pools SQL sans serveur Azure Synapse

Module 5 : Explorez, transformez et chargez les données dans l’entrepôt de données à l’aide d’Apache Spark

  • Leçon 1 : Comprendre l’ingénierie big data avec Apache Spark dans Azure Synapse Analytics
  • Leçon 2 : Ingérer des données Apache Spark notebooks dans Azure Synapse Analytics
  • Leçon 3 : Transformer les données avec DataFrames dans Apache Spark Pools dans Azure Synapse Analytics
  • Leçon 4 : Intégrer les pools SQL et Apache Spark dans Azure Synapse Analytics

Module 6 : Exploration et transformation des données dans Azure Databricks

  • Leçon 1 : Décrire Azure Databricks
  • Leçon 2 : Lire et écrire des données dans Azure Databricks
  • Leçon 3 : Travailler avec DataFrames dans Azure Databricks
  • Leçon 4 : Travailler avec Dataframes méthodes avancées dans Azure Databricks

Module 7 : Ingérer et charger des données dans l’entrepôt de données

  • Leçon 1 : Utiliser les meilleures pratiques de chargement de données dans Azure Synapse Analytics
  • Leçon 2 : Ingestion à l’échelle des pétaoctets avec Azure Data Factory

Module 8 : Transformez les données avec Azure Data Factory ou Azure Synapse Pipelines

  • Leçon 1 : Intégration de données avec Azure Data Factory ou Azure Synapse Pipelines
  • Leçon 2 : Transformation sans code à grande échelle avec Azure Data Factory ou Azure Synapse Pipelines

Module 9 : Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

  • Leçon 1 : Orchestrer le mouvement et la transformation des données dans Azure Data Factory

Module 10 : Optimisez les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

  • Leçon 1 : Optimiser les performances des requêtes d’entrepôt de données dans Azure Synapse Analytics
  • Leçon 2 : Comprendre les fonctionnalités des développeurs d’entrepôts de données d’Azure Synapse Analytics

Module 11 : Analyser et optimiser le stockage des entrepôts de données

  • Leçon 1 : Analyser et optimiser le stockage des entrepôts de données dans Azure Synapse Analytics

Module 12 : Supporter Hybrid Transactional Analytical Processing (HTAP) avec Azure Synapse Link

  • Leçon 1 : Concevoir un traitement transactionnel et analytique hybride à l’aide d’Azure Synapse Analytics
  • Leçon 2 : Configurer Azure Synapse Link avec Azure Cosmos DB
  • Leçon 3 : Requête Azure Cosmos DB avec pools Apache Spark
  • Leçon 4 : Requête Azure Cosmos DB avec pools SQL sans serveur

Module 13 : Sécurité de bout en bout avec Azure Synapse Analytics

  • Leçon 1 : Sécuriser un entrepôt de données dans Azure Synapse Analytics
  • Leçon 2 : Configurer et gérer les secrets dans Azure Key Vault
  • Leçon 3 : Mettre en place des contrôles de conformité pour les données sensibles

Module 14 : Traitement en temps réel des flux avec Stream Analytics

  • Leçon 1 : Activer des messageries fiables pour les applications Big Data à l’aide des Hubs d’événements Azure
  • Leçon 2 : Travailler avec les flux de données en utilisant Azure Stream Analytics
  • Leçon 3 : Ingérer des flux de données avec Azure Stream Analytics

Module 15 : Créer une solution de traitement des flux avec des concentrateurs d’événements et des databricks Azure

  • Leçon 1 : Traiter les données de streaming avec le streaming structuré Azure Databricks

Module 16 : Créez des rapports à l’aide de l’intégration Power BI avec Azure Synpase Analytics

  • Leçon 1 : Créer des rapports avec Power BI en utilisant son intégration avec Azure Synapse Analytics

Module 17 : Effectuer des processus intégrés d’apprentissage automatique dans Azure Synapse Analytics

  • Leçon 1 : Utilisez le processus d’apprentissage automatique intégré dans Azure Synapse Analytics

Documentation

  • Accès à Microsoft Learn (contenu d’apprentissage en ligne)

Lab / Exercices

Laboratoires officiels Microsoft

  • Lab 1 : Explorer les options de calcul et de stockage pour les charges de travail en ingénierie des données
  • Lab 2 : Conception et mise en œuvre de la couche de service
  • Lab 3 : Considérations d’ingénierie des données
  • Lab 4 : Exécutez des requêtes interactives à l’aide de pools SQL sans serveur
  • Lab 5 : Explorez, transformez et chargez les données dans l’entrepôt de données à l’aide d’Apache Spark
  • Lab 4 : Exploration et transformation de données dans Azure Databricks
  • Lab 5 : Ingérer et charger des données dans l’entrepôt de données
  • Lab 6 : Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Lab 7 : Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines
  • Lab 8 : Optimisez les performances des requêtes avec des pools SQL dédiés dans Azure Synapse
  • Lab 9 : Analyser et optimiser le stockage des entrepôts de données
  • Lab 10 : Support Hybrid Transactional Analytical Processing (HTAP) avec Azure Synapse Link
  • Lab 11 : Sécurité de bout en bout avec Azure Synapse Analytics
  • Lab 12 : Traitement en temps réel des flux avec Stream Analytics
  • Lab 13 : Créer une solution de traitement de flux avec Event Hubs et Azure Databricks
  • Lab 14 : Créer des rapports à l’aide de l’intégration Power BI avec Azure Synpase Analytics
  • Lab 15 : Effectuer des processus intégrés d’apprentissage automatique dans Azure Synapse Analytics

Examen

  • Ce cours prépare à la certification DP-203 : Data Engineering on Microsoft Azure. Si vous souhaitez passer cet examen, merci de contacter notre secrétariat qui vous communiquera son prix et s’occupera de toutes les démarches administratives nécessaires pour vous.

Cours complémentaires

Financement Temptraining

ITTA est partenaire de Temptraining, le fonds de formation continue pour les travailleurs temporaires. Ce fonds de formation peut subventionner des formations continues pour toute personne qui travaille pour un employeur assujetti à la Convention collective de travail (CCT) Location de services.

Informations additionnelles

Formation Data Engineering on Microsoft Azure (DP-203)

Optimisez vos compétences en ingénierie des données avec Azure

La formation Data Engineering on Microsoft Azure (DP-203) vous offre une opportunité unique de maîtriser les outils et services essentiels d’Azure pour l’ingénierie des données. Voici un aperçu des principaux aspects de cette formation et des compétences que vous allez acquérir.

Comprendre Azure Synapse Analytics et Azure Databricks

Azure Synapse Analytics est une solution de bout en bout pour l’ingestion, la préparation, la gestion et la mise à disposition de données pour les besoins immédiats de BI et d’apprentissage automatique. Vous découvrirez comment cette plateforme unifiée combine des technologies de traitement des données massives et des entrepôts de données, facilitant ainsi la gestion des charges de travail analytiques complexes.

Azure Databricks, basé sur Apache Spark, est conçu pour l’analytique Big Data. Il permet aux ingénieurs des données de collaborer efficacement tout en intégrant facilement d’autres services Azure pour des analyses de bout en bout.

Stockage et gestion des données avec Azure Data Lake

Le stockage de données est crucial pour toute infrastructure de données. Azure Data Lake offre une solution scalable et performante pour stocker et gérer de grandes quantités de données structurées et non structurées. Vous apprendrez à exploiter ses capacités pour optimiser vos charges de travail en ingénierie des données.

Architecture du lac Delta et flux de données en temps réel

L’architecture du lac Delta combine les avantages des lacs de données et des entrepôts de données, permettant une gestion plus efficace des données et une amélioration des performances des requêtes. De plus, avec Azure Stream Analytics, vous pourrez analyser les flux de données en temps réel, ce qui est essentiel pour obtenir des insights instantanés et prendre des décisions éclairées.

Concevoir et implémenter des solutions de données robustes

Un ingénieur des données sur Azure doit être capable de concevoir des schémas multidimensionnels optimisés pour les charges de travail analytiques. Cette formation vous permettra de comprendre comment créer des architectures de données robustes qui soutiennent des analyses complexes tout en assurant la scalabilité et la performance.

Sécurisation et gestion des données dans Azure

La sécurité des données est une priorité. Vous apprendrez à sécuriser vos entrepôts de données en utilisant les meilleures pratiques d’Azure, notamment avec Azure Key Vault pour la gestion des secrets et des clés. La formation couvre également les contrôles de conformité nécessaires pour protéger les données sensibles.

Orchestration et transformation des données à grande échelle

L’orchestration et la transformation des données sont essentielles pour toute solution de données efficace. Grâce à Azure Data Factory et aux pipelines d’Azure Synapse, vous pourrez automatiser et gérer les flux de données à grande échelle, en utilisant des transformations sans code pour simplifier les processus.

Optimisation des performances des requêtes

L’optimisation des performances des requêtes est cruciale pour garantir des temps de réponse rapides et une utilisation efficace des ressources. Vous découvrirez les techniques pour optimiser les performances des requêtes dans Azure Synapse Analytics, ce qui est essentiel pour gérer efficacement les entrepôts de données.

Supporter HTAP avec Azure Synapse Link

Le traitement hybride transactionnel et analytique (HTAP) est supporté par Azure Synapse Link, qui permet de connecter directement les bases de données transactionnelles avec les services analytiques. Cette intégration permet des analyses en temps réel sans impacter les opérations transactionnelles.

Intégration de Power BI pour des rapports interactifs

La création de rapports interactifs avec Power BI intégrée à Azure Synapse Analytics vous permettra de visualiser et d’explorer vos données de manière intuitive, facilitant ainsi la prise de décision basée sur des données actualisées et précises.

Questions courantes sur le DP-203 et le rôle de Data Engineer sur Azure

Qu’est-ce que le DP-203 dans Azure ?
Le DP-203 est un examen de certification pour les ingénieurs des données sur Microsoft Azure. Il évalue vos compétences à concevoir et implémenter des solutions de gestion des données, en utilisant les services Azure tels qu’Azure Synapse Analytics, Azure Data Factory, et Azure Databricks.

Que fait un Microsoft Azure Data Engineer ?
Un ingénieur des données sur Microsoft Azure est responsable de la conception, de la mise en œuvre et de la gestion des solutions de données qui permettent aux organisations de collecter, stocker, transformer et analyser de grandes quantités de données. Ils utilisent des outils et des services Azure pour automatiser les flux de données, assurer la sécurité et optimiser les performances des systèmes de données.

En suivant cette formation Data Engineering on Microsoft Azure (DP-203), vous acquerrez les compétences nécessaires pour exceller en tant qu’ingénieur des données sur Azure, vous préparant ainsi à relever les défis de l’ingénierie des données moderne.

Prix de l'inscription
CHF 3'000.-
Inclus dans ce cours
  • 180 jours d’accessibilité aux laboratoires
  • Matériel didactique à jour avec Microsoft Learn
  • Badge de réussite du cours Microsoft

lun12Aoû(Aoû 12)09:00jeu15(Aoû 15)17:00VirtuelVirtuel Etiquettes de sessionDP-203T00

lun12Aoû(Aoû 12)09:00jeu15(Aoû 15)17:00Genève, Route des Jeunes 33B, 1227 Carouge Etiquettes de sessionDP-203T00

lun16Sep(Sep 16)09:00jeu19(Sep 19)17:00VirtuelVirtuel Etiquettes de sessionDP-203T00

lun16Sep(Sep 16)09:00jeu19(Sep 19)17:00Lausanne, Avenue Mon repos 24, 1005 Lausanne Etiquettes de sessionDP-203T00

lun21Oct(Oct 21)09:00jeu24(Oct 24)17:00VirtuelVirtuel Etiquettes de sessionDP-203T00

lun21Oct(Oct 21)09:00jeu24(Oct 24)17:00Genève, Route des Jeunes 33B, 1227 Carouge Etiquettes de sessionDP-203T00

lun25Nov(Nov 25)09:00jeu28(Nov 28)17:00VirtuelVirtuel Etiquettes de sessionDP-203T00

lun25Nov(Nov 25)09:00jeu28(Nov 28)17:00Lausanne, Avenue Mon repos 24, 1005 Lausanne Etiquettes de sessionDP-203T00

Horaires d’ouverture

Du lundi au vendredi, de 8:30 à 18:00.

Contactez-nous

Votre demande

X
X
X
X