Formation : Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Ref. DP-3027

Télécharger en PDF

Durée :

jour

Examen :

Non certifiant

Niveau :

Intermédiaire

Home > Formations > Informatique > Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Formation Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Vous devez construire des pipelines de données fiables capables de traiter des teraoctets d’informations provenant de sources hétérogènes. Les outils traditionnels d’ETL peinent a suivre la croissance exponentielle des volumes et la diversite des formats. Azure Databricks resout cette problematique en combinant la puissance d’Apache Spark avec une plateforme collaborative optimisée pour l’ingenierie des données a grande échelle. Cette formation DP-3027 vous apprend à concevoir, implémenter et orchestrer des solutions complètes de data engineering sur Azure Databricks, du lakehouse à la mise en production. C’est précisément l’objectif de cette formation Data Engineering Databricks.

En une journée intensive chez ITTA, Microsoft Learning Partner en Suisse romande, vous mettez en pratique les concepts fondamentaux du data engineering avec Azure Databricks. Sous la supervision d’un formateur certifié MCT, vous travaillez dans les labs cloud officiels Microsoft pour créer des pipelines d’ingestion, transformer les données avec PySpark et Delta Lake, et orchestrer vos workflows avec les jobs Databricks. Proposee à Genève et Lausanne en presentiel ou en classe virtuelle, cette formation vous prépare à valider l’Applied Skill Microsoft et a livrer des architectures de données performantes dans votre entreprise.

Profils des Participants

Ingénieur Data
Développeur Big Data
Architecte Cloud
Consultant Data
Administrateur Azure
Responsable BI

Objectifs

Concevoir une architecture lakehouse sur Azure Databricks
Créer des pipelines d’ingestion de données depuis des sources variees
Transformer les données avec PySpark et les notebooks Databricks
Implémenter le stockage en couches avec Delta Lake (bronze, silver, gold)
Orchestrer et planifier les workflows avec les jobs Databricks
Surveiller les performances des pipelines et gérer les erreurs

Connaissances Préalables

Savoir utiliser un ordinateur
Comprendre les bases du cloud

Contenu du Cours

Module 1 : Effectuer un traitement incrémentiel avec Spark Structured Streaming

Configurer des sources de données en temps réel pour le traitement incrémentiel
Optimiser Delta Lake pour le traitement incrémentiel dans Azure Databricks
Gérer les données tardives et les événements non ordonnés dans le traitement incrémentiel
Stratégies de monitoring et de réglage des performances pour le traitement incrémentiel dans Azure Databricks

Module 2 : Implémenter des modèles d’architecture de diffusion en continu avec Delta Live Tables

Architectures pilotées par les événements avec des tables Delta Live
Ingérer des données avec le streaming structuré
Maintenir la cohérence et la fiabilité des données avec la diffusion en continu structurée
Mettre à l’échelle des charges de travail de streaming avec des tables Delta Live

Module 3 : Optimiser les performances avec Spark et Delta Live Tables

Optimiser les performances avec Spark et Delta Live Tables
Effectuer l’optimisation basée sur les coûts et le réglage des requêtes
Utiliser la capture des changements de données (CDC)
Utiliser la mise à l’échelle automatique améliorée
Implémenter des métriques d’observabilité et de qualité des données

Module 4 : Implémenter des workflows d’intégration continue et livraison continue (CI/CD) dans Azure Databricks

Implémenter la gestion de version et l’intégration Git
Effectuer des tests d’intégration et des tests unitaires
Gérer et configurer votre environnement
Implémenter des stratégies de restauration et de restauration par progression

Module 5 : Automatiser des charges de travail avec des travaux Azure Databricks

Implémenter la planification et l’automatisation de travaux
Optimiser les workflows avec des paramètres
Traiter la gestion des dépendances
Implémenter la gestion des erreurs et les mécanismes de nouvelle tentative
Découvrir les règles et meilleures pratiques

Module 6 : Gérer la confidentialité et la gouvernance des données avec Azure Databricks

Mettre en œuvre des techniques de chiffrement de données dans Azure Databricks
Gérer les contrôles d’accès dans Azure Databricks
Mettre en œuvre le masquage des données et l’anonymisation dans Azure Databricks
Utiliser le partage de données sécurisé et les infrastructures de conformité dans Azure Databricks
Utiliser la gestion des métadonnées et la traçabilité des données
Mettre en œuvre l’automatisation de la gouvernance dans Azure Databricks

Module 7 : Utiliser des entrepôts SQL dans Azure Databricks

Prise en main de SQL Warehouses
Créer des bases de données et des tables
Créer des requêtes et des tableaux de bord

Module 8 : Exécuter des notebooks Azure Databricks avec Azure Data Factory

Comprendre les notebooks et pipelines Azure Databricks
Créer un service lié pour Azure Databricks
Utiliser une activité Notebook dans un pipeline
Utiliser des paramètres dans un carnet

Documentation

Accès à Microsoft Learn, la plateforme d’apprentissage en ligne Microsoft, offrant des ressources interactives et des contenus pédagogiques pour approfondir vos connaissances et développer vos compétences techniques.

Lab / Exercices

Ce cours vous donne un accès exclusif au laboratoire officiel Microsoft, vous permettant de mettre en pratique vos compétences dans un environnement professionnel.

Cours complémentaires

Informations Additionnelles

formation Data Engineering Databricks : Azure Databricks : la plateforme de référence pour le data engineering

Azure Databricks s’est impose comme la plateforme leader pour les projets de data engineering d’envergure. Fondee sur Apache Spark, elle offre des performances de traitement distribue tout en simplifiant la collaboration entre data engineers, data scientists et analystes. L’architecture lakehouse combine les avantages des data lakes (stockage economique de données brutes) avec la fiabilité transactionnelle des data warehouses grâce a Delta Lake. Pour les entreprises suisses qui traitent des volumes croissants de données, Azure Databricks permet de construire des pipelines robustes qui alimentent aussi bien les tableaux de bord analytiques que les modèles de machine learning. L’intégration native avec Azure Data Factory, Azure Synapse et Power BI facilité la construction d’écosystèmes de données complets.

Profil des participants à la formation DP-3027

Cette formation est concue pour les data engineers, les ingénieurs ETL et les développeurs qui souhaitent maîtriser Azure Databricks pour construire des pipelines de données. Elle interesse également les architectes de données qui evaluent la plateforme pour leurs projets lakehouse. Un niveau intermédiaire est requis : vous devez avoir des bases en programmation Python, connaitre les concepts fondamentaux des bases de données et comprendre les principes du cloud Azure. Une première expérience avec Spark ou les notebooks est un plus, mais n’est pas indispensable car la formation couvre les fondamentaux avant les scénarios avancés.

Programme détaillé de la journée de formation

La matinee debute par la présentation de l’architecture lakehouse et la configuration d’un workspace Azure Databricks. Vous créez votre premier cluster, explorez l’interface des notebooks et découvrez l’intégration avec Azure Data Lake Storage. Vous implementez ensuite un pipeline d’ingestion qui charge des données brutes dans la couche bronze de votre lakehouse. L’après-midi se concentre sur les transformations avec PySpark : nettoyage, enrichissement et aggregation des données pour alimenter les couches silver et gold en utilisant Delta Lake. Vous apprenez a gérer les schemas evolutifs, les opérations de merge (upsert) et le time travel. La journée se termine par l’orchestration des workflows : création de jobs Databricks multi-tâches, planification et monitoring des executions. Tous les exercices s’appuient sur les labs cloud officiels du cursus MOC Microsoft.

Pourquoi choisir ITTA pour votre formation Databricks

ITTA est Microsoft Learning Partner officiel en Suisse romande, ce qui vous garantit des supports de cours et des environnements de labs toujours à jour avec les dernières fonctionnalités de la plateforme. Nos formateurs MCT pratiquent le data engineering au quotidien et partagent des retours d’expérience concrets qui enrichissent les exercices théoriques avec des cas d’usage rencontres en entreprise. Les formations se déroulent en petits groupes à Genève ou Lausanne, en presentiel ou en classe virtuelle, pour assurer un accompagnement personnalisé sur chaque exercice. Le format interactif vous permet d’échanger avec le formateur sur vos problematiques spécifiques et de répartir avec des solutions adaptees à votre contexte. à l’issue de la journée, vous possedez les compétences pratiques pour implémenter des solutions de data engineering sur Azure Databricks et vous etes prépare pour l’évaluation Applied Skill Microsoft DP-3027.

FAQ – Formation Data Engineering Azure Databricks DP-3027

Quelle est la différence entre Azure Databricks et Azure Synapse Analytics ?

Azure Databricks excelle dans le traitement distribue avec Spark et l’architecture lakehouse, tandis que Synapse combine un data warehouse serverless avec des capacités Spark. Pour le data engineering a grande échelle, Databricks offre généralement plus de flexibilité et de performance sur les workloads Spark.

Faut-il connaitre Apache Spark pour suivre cette formation ?

Une connaissance prealable de Spark est un avantage mais n’est pas obligatoire. La formation couvre les bases de PySpark nécessaires pour réaliser les exercices. En revanche, des bases en Python sont indispensables.

Qu’est-ce que Delta Lake et pourquoi est-ce important ?

Delta Lake est une couche de stockage open source qui ajoute la fiabilité transactionnelle (ACID) au data lake. Elle permet le versionning des données, les opérations de merge et le time travel, ce qui est essentiel pour construire des pipelines de données fiables.

L’Applied Skill DP-3027 remplace-t-elle la certification DP-203 ?

Non, l’Applied Skill valide une compétence spécifique sur Azure Databricks, tandis que la certification DP-203 (Data Engineering on Microsoft Azure) couvre un spectre plus large. Les deux credentials sont complémentaires.

Les labs sont-ils accessibles après la formation ?

Les labs cloud Microsoft sont accessibles pendant la durée de la formation. Pour continuer a pratiquer ensuite, vous pouvez utiliser un compte Azure gratuit ou un abonnement existant pour déployer votre propre workspace Databricks.

Cette formation couvre-t-elle Databricks Unity Catalog ?

La formation se concentre sur les fondamentaux du data engineering avec Azure Databricks. Unity Catalog peut etre evoque en fonction des questions des participants, mais le programme principal porte sur les pipelines, Delta Lake et l’orchestration des workflows.

Peut-on suivre cette formation sans expérience cloud ?

Une connaissance de base du portail Azure est recommandee pour profiter pleinement de la formation. Si vous debutez avec Azure, nous vous conseillons de suivre d’abord une formation d’introduction aux fondamentaux Azure.

Prix de l'inscription

CHF 850.-

Inclus dans ce cours

Formation dispensée par un formateur certifié
180 jours d’accès aux labs Officiels Microsoft
Documentation Officielle au format digital
Badge de réussite Officiel Microsoft

Mois actuel

lun24Aoû09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun24Aoû09:00lun17:00Genève, Route des Jeunes 35, 1227 Genève Etiquettes de sessionDP-3027

lun28Sep09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun28Sep09:00lun17:00Lausanne, Av. Mon-Repos 24, 1005 Lausanne Etiquettes de sessionDP-3027

lun02Nov09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun02Nov09:00lun17:00Genève, Route des Jeunes 35, 1227 Genève Etiquettes de sessionDP-3027

lun07Déc09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun07Déc09:00lun17:00Lausanne, Av. Mon-Repos 24, 1005 Lausanne Etiquettes de sessionDP-3027

Formation : Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Formation Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Profils des Participants

Objectifs

Connaissances Préalables

Contenu du Cours

Documentation

Lab / Exercices

Cours complémentaires

Informations Additionnelles

formation Data Engineering Databricks : Azure Databricks : la plateforme de référence pour le data engineering

Profil des participants à la formation DP-3027

Programme détaillé de la journée de formation

Pourquoi choisir ITTA pour votre formation Databricks

FAQ – Formation Data Engineering Azure Databricks DP-3027

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Formation : Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Formation Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Profils des Participants

Objectifs

Connaissances Préalables

Contenu du Cours

Documentation

Lab / Exercices

Cours complémentaires

Informations Additionnelles

formation Data Engineering Databricks : Azure Databricks : la plateforme de référence pour le data engineering

Profil des participants à la formation DP-3027

Programme détaillé de la journée de formation

Pourquoi choisir ITTA pour votre formation Databricks

FAQ – Formation Data Engineering Azure Databricks DP-3027

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Ticket Section Title

Prix total CHF 850.00

Ticket Section Title

Prix total CHF 900.00

Horaires d’ouverture

Contactez-Nous

Faire une demande

Horaires d’ouverture

Contactez-Nous

Faire une demande