☀️ C'est l'été chez ITTA ! Profitez de 10% de réduction jusqu'au 31 juillet sur une sélection de formations 🌴

Formation : Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Durée :
1
 jour
Examen :
Non certifiant
Niveau :
Intermédiaire

Formation Implémenter une solution engineering données avec Azure Databricks (DP-3027)

Vous devez construire des pipelines de données fiables capables de traiter des teraoctets d’informations provenant de sources hétérogènes. Les outils traditionnels d’ETL peinent a suivre la croissance exponentielle des volumes et la diversite des formats. Azure Databricks resout cette problematique en combinant la puissance d’Apache Spark avec une plateforme collaborative optimisée pour l’ingenierie des données a grande échelle. Cette formation DP-3027 vous apprend à concevoir, implémenter et orchestrer des solutions complètes de data engineering sur Azure Databricks, du lakehouse à la mise en production. C’est précisément l’objectif de cette formation Data Engineering Databricks.

En une journée intensive chez ITTA, Microsoft Learning Partner en Suisse romande, vous mettez en pratique les concepts fondamentaux du data engineering avec Azure Databricks. Sous la supervision d’un formateur certifié MCT, vous travaillez dans les labs cloud officiels Microsoft pour créer des pipelines d’ingestion, transformer les données avec PySpark et Delta Lake, et orchestrer vos workflows avec les jobs Databricks. Proposee à Genève et Lausanne en presentiel ou en classe virtuelle, cette formation vous prépare à valider l’Applied Skill Microsoft et a livrer des architectures de données performantes dans votre entreprise.

Profils des Participants

  • Ingénieur Data
  • Développeur Big Data
  • Architecte Cloud
  • Consultant Data
  • Administrateur Azure
  • Responsable BI

Objectifs

  • Concevoir une architecture lakehouse sur Azure Databricks
  • Créer des pipelines d’ingestion de données depuis des sources variees
  • Transformer les données avec PySpark et les notebooks Databricks
  • Implémenter le stockage en couches avec Delta Lake (bronze, silver, gold)
  • Orchestrer et planifier les workflows avec les jobs Databricks
  • Surveiller les performances des pipelines et gérer les erreurs

Connaissances Préalables

  • Savoir utiliser un ordinateur
  • Comprendre les bases du cloud

Contenu du Cours

Module 1 : Effectuer un traitement incrémentiel avec Spark Structured Streaming

  • Configurer des sources de données en temps réel pour le traitement incrémentiel
  • Optimiser Delta Lake pour le traitement incrémentiel dans Azure Databricks
  • Gérer les données tardives et les événements non ordonnés dans le traitement incrémentiel
  • Stratégies de monitoring et de réglage des performances pour le traitement incrémentiel dans Azure Databricks

Module 2 : Implémenter des modèles d’architecture de diffusion en continu avec Delta Live Tables

  • Architectures pilotées par les événements avec des tables Delta Live
  • Ingérer des données avec le streaming structuré
  • Maintenir la cohérence et la fiabilité des données avec la diffusion en continu structurée
  • Mettre à l’échelle des charges de travail de streaming avec des tables Delta Live

Module 3 : Optimiser les performances avec Spark et Delta Live Tables

  • Optimiser les performances avec Spark et Delta Live Tables
  • Effectuer l’optimisation basée sur les coûts et le réglage des requêtes
  • Utiliser la capture des changements de données (CDC)
  • Utiliser la mise à l’échelle automatique améliorée
  • Implémenter des métriques d’observabilité et de qualité des données

Module 4 : Implémenter des workflows d’intégration continue et livraison continue (CI/CD) dans Azure Databricks

  • Implémenter la gestion de version et l’intégration Git
  • Effectuer des tests d’intégration et des tests unitaires
  • Gérer et configurer votre environnement
  • Implémenter des stratégies de restauration et de restauration par progression

Module 5 : Automatiser des charges de travail avec des travaux Azure Databricks

  • Implémenter la planification et l’automatisation de travaux
  • Optimiser les workflows avec des paramètres
  • Traiter la gestion des dépendances
  • Implémenter la gestion des erreurs et les mécanismes de nouvelle tentative
  • Découvrir les règles et meilleures pratiques

Module 6 : Gérer la confidentialité et la gouvernance des données avec Azure Databricks

  • Mettre en œuvre des techniques de chiffrement de données dans Azure Databricks
  • Gérer les contrôles d’accès dans Azure Databricks
  • Mettre en œuvre le masquage des données et l’anonymisation dans Azure Databricks
  • Utiliser le partage de données sécurisé et les infrastructures de conformité dans Azure Databricks
  • Utiliser la gestion des métadonnées et la traçabilité des données
  • Mettre en œuvre l’automatisation de la gouvernance dans Azure Databricks

Module 7 : Utiliser des entrepôts SQL dans Azure Databricks

  • Prise en main de SQL Warehouses
  • Créer des bases de données et des tables
  • Créer des requêtes et des tableaux de bord

Module 8 : Exécuter des notebooks Azure Databricks avec Azure Data Factory

  • Comprendre les notebooks et pipelines Azure Databricks
  • Créer un service lié pour Azure Databricks
  • Utiliser une activité Notebook dans un pipeline
  • Utiliser des paramètres dans un carnet

Documentation

  • Accès à Microsoft Learn, la plateforme d’apprentissage en ligne Microsoft, offrant des ressources interactives et des contenus pédagogiques pour approfondir vos connaissances et développer vos compétences techniques.

Lab / Exercices

  • Ce cours vous donne un accès exclusif au laboratoire officiel Microsoft, vous permettant de mettre en pratique vos compétences dans un environnement professionnel.

Cours complémentaires

Informations Additionnelles

formation Data Engineering Databricks : Azure Databricks : la plateforme de référence pour le data engineering

Azure Databricks s’est impose comme la plateforme leader pour les projets de data engineering d’envergure. Fondee sur Apache Spark, elle offre des performances de traitement distribue tout en simplifiant la collaboration entre data engineers, data scientists et analystes. L’architecture lakehouse combine les avantages des data lakes (stockage economique de données brutes) avec la fiabilité transactionnelle des data warehouses grâce a Delta Lake. Pour les entreprises suisses qui traitent des volumes croissants de données, Azure Databricks permet de construire des pipelines robustes qui alimentent aussi bien les tableaux de bord analytiques que les modèles de machine learning. L’intégration native avec Azure Data Factory, Azure Synapse et Power BI facilité la construction d’écosystèmes de données complets.

Profil des participants à la formation DP-3027

Cette formation est concue pour les data engineers, les ingénieurs ETL et les développeurs qui souhaitent maîtriser Azure Databricks pour construire des pipelines de données. Elle interesse également les architectes de données qui evaluent la plateforme pour leurs projets lakehouse. Un niveau intermédiaire est requis : vous devez avoir des bases en programmation Python, connaitre les concepts fondamentaux des bases de données et comprendre les principes du cloud Azure. Une première expérience avec Spark ou les notebooks est un plus, mais n’est pas indispensable car la formation couvre les fondamentaux avant les scénarios avancés.

Programme détaillé de la journée de formation

La matinee debute par la présentation de l’architecture lakehouse et la configuration d’un workspace Azure Databricks. Vous créez votre premier cluster, explorez l’interface des notebooks et découvrez l’intégration avec Azure Data Lake Storage. Vous implementez ensuite un pipeline d’ingestion qui charge des données brutes dans la couche bronze de votre lakehouse. L’après-midi se concentre sur les transformations avec PySpark : nettoyage, enrichissement et aggregation des données pour alimenter les couches silver et gold en utilisant Delta Lake. Vous apprenez a gérer les schemas evolutifs, les opérations de merge (upsert) et le time travel. La journée se termine par l’orchestration des workflows : création de jobs Databricks multi-tâches, planification et monitoring des executions. Tous les exercices s’appuient sur les labs cloud officiels du cursus MOC Microsoft.

Pourquoi choisir ITTA pour votre formation Databricks

ITTA est Microsoft Learning Partner officiel en Suisse romande, ce qui vous garantit des supports de cours et des environnements de labs toujours à jour avec les dernières fonctionnalités de la plateforme. Nos formateurs MCT pratiquent le data engineering au quotidien et partagent des retours d’expérience concrets qui enrichissent les exercices théoriques avec des cas d’usage rencontres en entreprise. Les formations se déroulent en petits groupes à Genève ou Lausanne, en presentiel ou en classe virtuelle, pour assurer un accompagnement personnalisé sur chaque exercice. Le format interactif vous permet d’échanger avec le formateur sur vos problematiques spécifiques et de répartir avec des solutions adaptees à votre contexte. à l’issue de la journée, vous possedez les compétences pratiques pour implémenter des solutions de data engineering sur Azure Databricks et vous etes prépare pour l’évaluation Applied Skill Microsoft DP-3027.

FAQ – Formation Data Engineering Azure Databricks DP-3027

Quelle est la différence entre Azure Databricks et Azure Synapse Analytics ?

Azure Databricks excelle dans le traitement distribue avec Spark et l’architecture lakehouse, tandis que Synapse combine un data warehouse serverless avec des capacités Spark. Pour le data engineering a grande échelle, Databricks offre généralement plus de flexibilité et de performance sur les workloads Spark.

Faut-il connaitre Apache Spark pour suivre cette formation ?

Une connaissance prealable de Spark est un avantage mais n’est pas obligatoire. La formation couvre les bases de PySpark nécessaires pour réaliser les exercices. En revanche, des bases en Python sont indispensables.

Qu’est-ce que Delta Lake et pourquoi est-ce important ?

Delta Lake est une couche de stockage open source qui ajoute la fiabilité transactionnelle (ACID) au data lake. Elle permet le versionning des données, les opérations de merge et le time travel, ce qui est essentiel pour construire des pipelines de données fiables.

L’Applied Skill DP-3027 remplace-t-elle la certification DP-203 ?

Non, l’Applied Skill valide une compétence spécifique sur Azure Databricks, tandis que la certification DP-203 (Data Engineering on Microsoft Azure) couvre un spectre plus large. Les deux credentials sont complémentaires.

Les labs sont-ils accessibles après la formation ?

Les labs cloud Microsoft sont accessibles pendant la durée de la formation. Pour continuer a pratiquer ensuite, vous pouvez utiliser un compte Azure gratuit ou un abonnement existant pour déployer votre propre workspace Databricks.

Cette formation couvre-t-elle Databricks Unity Catalog ?

La formation se concentre sur les fondamentaux du data engineering avec Azure Databricks. Unity Catalog peut etre evoque en fonction des questions des participants, mais le programme principal porte sur les pipelines, Delta Lake et l’orchestration des workflows.

Peut-on suivre cette formation sans expérience cloud ?

Une connaissance de base du portail Azure est recommandee pour profiter pleinement de la formation. Si vous debutez avec Azure, nous vous conseillons de suivre d’abord une formation d’introduction aux fondamentaux Azure.

Prix de l'inscription
CHF 850.-
Inclus dans ce cours
  • Formation dispensée par un formateur certifié
  • 180 jours d’accès aux labs Officiels Microsoft
  • Documentation Officielle au format digital
  • Badge de réussite Officiel Microsoft
Mois actuel

lun15Juin09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun15Juin09:00lun17:00Genève, Route des Jeunes 35, 1227 Genève Etiquettes de sessionDP-3027

lun20juil09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun20juil09:00lun17:00Lausanne, Av. Mon-Repos 24, 1005 Lausanne Etiquettes de sessionDP-3027

lun24Aoû09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun24Aoû09:00lun17:00Genève, Route des Jeunes 35, 1227 Genève Etiquettes de sessionDP-3027

lun28Sep09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun28Sep09:00lun17:00Lausanne, Av. Mon-Repos 24, 1005 Lausanne Etiquettes de sessionDP-3027

lun02Nov09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun02Nov09:00lun17:00Genève, Route des Jeunes 35, 1227 Genève Etiquettes de sessionDP-3027

lun07Déc09:00lun17:00VirtuelVirtuel Etiquettes de sessionDP-3027

lun07Déc09:00lun17:00Lausanne, Av. Mon-Repos 24, 1005 Lausanne Etiquettes de sessionDP-3027

Contact

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Horaires d’ouverture

Du lundi au vendredi

de 8h30 à 18h00

Tél. 058 307 73 00

Contactez-Nous

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Faire une demande

Horaires d’ouverture

Du lundi au vendredi

de 8h30 à 18h00

Tél. 058 307 73 00

Contactez-Nous

ITTA
Route des jeunes 35
1227 Carouge, Suisse

Faire une demande