MON COMPTE

Formations AWS Data Engineering

ITTA propose un catalogue AWS Data Engineering : Building Batch Data Analytics Solutions on AWS (Glue, EMR, Athena, Redshift) et Deep Learning on AWS pour les profils data + IA. Les formations préparent les data engineers, architectes data et data scientists à construire des pipelines analytiques managés sur AWS. Public : data engineers, architectes data, BI, data scientists cloud. Sessions à Genève, Lausanne et en classe virtuelle interactive.

Sujet

Editeur

Sujet

Editeur

Solution

Home > Formations > AWS - Amazon Web Services > AWS Data Engineering

FILTRER PAR

- Domaines

- Editeurs

- Lieu

- Format

- Niveau

- Certifiant

- Cours confirmé

AWS-301

AWS – Building Batch Data Analytics Solutions on AWS

AWS – Building Batch Data Analytics Solutions on AWS » : Formez-vous à la création de pipelines analytiques efficaces sur AWS avec Amazon EMR.

Fondamental

jour

Certifiant

Virtuel

Dès CHF 850.-

AWS Data Engineering en 2026 : le lakehouse managé

Le sous-éditeur AWS Data Engineering regroupe au catalogue ITTA les formations data sur AWS. En 2026, AWS propose une stack data très complète, organisée autour d’une architecture lakehouse managée : stockage objet S3 comme data lake, AWS Glue pour l’ETL et le data catalog, Amazon Athena pour le SQL serverless sur S3, Amazon Redshift comme data warehouse, Amazon EMR pour Spark managé, Amazon Kinesis pour le streaming, Amazon QuickSight pour la BI. Le format de table Apache Iceberg est désormais natif sur AWS (Glue, Athena, EMR, Redshift), ce qui aligne AWS avec les pratiques lakehouse modernes (transactions ACID, time travel, schema evolution).

La certification AWS Certified Data Engineer Associate (DEA-C01), lancée en 2024 et stabilisée en 2026, valide les compétences de data engineering sur AWS. Elle complète la certification AWS Certified Machine Learning Specialty pour les profils data + IA. Cette structure de certifications reflète la spécialisation croissante des métiers data : data engineer (pipelines), data scientist (modèles), MLOps (industrialisation), data analyst (BI), data architect (architecture).

Les formations AWS Data Engineering au catalogue ITTA

Notre catalogue AWS Data Engineering chez ITTA :

AWS – Building Batch Data Analytics Solutions on AWS

La formation Building Batch Data Analytics Solutions on AWS est une formation officielle AWS qui couvre les services data analytics en mode batch : conception d’un data lake sur S3, partitionnement et formats (Parquet, ORC, Iceberg), AWS Glue pour les jobs ETL et le data catalog, Amazon Athena pour les requêtes SQL serverless, Amazon Redshift comme entrepôt de données (architecture, distribution, sort keys, Spectrum pour interroger S3), Amazon EMR pour les charges Spark à grande échelle, AWS Lake Formation pour la gouvernance et les permissions fines, intégration BI (QuickSight, outils tiers). Le format est intensif et hands-on, avec des labs sur un environnement AWS réel.

Pourquoi se former à la stack data AWS

AWS est un fournisseur cloud très utilisé sur les projets data en Suisse romande et à l’international. La maîtrise de Glue, Athena, Redshift, EMR et S3 est devenue une compétence très demandée pour les data engineers, qu’ils travaillent dans la banque, l’assurance, le secteur public, l’industrie, le retail ou le SaaS. Apprendre cette stack avec un parcours structuré raccourcit considérablement la montée en compétence par rapport à une auto-formation. La formation aborde aussi les arbitrages avec les alternatives : Databricks sur AWS, Snowflake sur AWS, Dremio, ainsi que les services équivalents Azure et GCP.

Cours phares de cette catégorie

AWS – Building Batch Data Analytics Solutions on AWS

AWS Data Engineering dans l’écosystème AWS ITTA

AWS Data Engineering s’inscrit dans le catalogue AWS plus large. Pour démarrer sur AWS, l’éditeur AWS Foundation couvre les fondamentaux (CLF-C02 Cloud Practitioner, Solutions Architect Associate). L’éditeur racine AWS (Amazon Web Services) regroupe l’ensemble des certifications AWS. Pour la dimension DevOps et conteneurs sur AWS, l’éditeur AWS DevOps couvre EKS, ECS, Fargate.

Côté data plus généralement, le sous-domaine science des données apporte les usages analytiques côté data engineering et IA. Le sous-domaine analyse et bases de données couvre les compétences administration et BI. Pour les profils qui combinent AWS et IA appliquée, l’éditeur ITTA Intelligence Artificielle permet de prolonger vers les usages IA générative et MLOps.

Public visé par AWS Data Engineering

Notre audience AWS Data Engineering est variée. On y croise des data engineers qui construisent ou maintiennent des pipelines AWS, des architectes data qui valident un choix lakehouse sur AWS pour un nouveau projet, des data analysts qui veulent comprendre l’environnement technique sous leurs dashboards Athena ou Redshift, des data scientists qui doivent industrialiser leurs modèles sur EMR ou SageMaker, des DBA en transition vers le cloud, des consultants data qui interviennent sur des projets de modernisation data warehouse vers le lakehouse en Suisse romande et à l’international.

Lakehouse AWS vs Databricks vs Snowflake : comment se positionner ?

Le paysage data 2026 est riche en options. La stack AWS native (S3 + Glue + Athena + Redshift + EMR) est très utilisée par les équipes déjà ancrées dans l’écosystème AWS et qui veulent une intégration native avec IAM, VPC, observabilité, IaC. Databricks sur AWS apporte une expérience lakehouse unifiée avec Delta Lake, Unity Catalog et MLflow, particulièrement adaptée aux organisations data + IA exigeantes. Snowflake sur AWS propose un data warehouse cloud-native multi-providers avec une expérience SQL simple. Le choix dépend des priorités : intégration AWS native, expérience lakehouse end-to-end, simplicité SQL pure, multi-cloud. Notre formation aborde ce positionnement en début de session.

Trajectoires fréquentes selon votre profil

Vous êtes data engineer en transition vers AWS

Vous arrivez d’un environnement on-premise (Hadoop, ETL classique, data warehouse traditionnel) et vous devez basculer sur AWS. La formation Building Batch Data Analytics Solutions vous donne le socle technique pour piloter cette transition, en comprenant Glue, Athena, Redshift et EMR dans leur contexte d’usage.

Vous êtes architecte data sur projet de modernisation

Vous pilotez une modernisation data warehouse vers le lakehouse AWS. La formation vous donne les arbitrages techniques (formats Iceberg vs Parquet brut, Redshift vs Athena, EMR vs Glue) pour structurer la cible et la trajectoire de migration.

Vous êtes data analyst ou BI

Vous voulez comprendre l’environnement sous vos requêtes Athena ou vos dashboards QuickSight. La formation vous donne la compréhension des couches data lake et data warehouse, sans imposer une expertise data engineering complète.

Tendances data engineering AWS en 2026

Plusieurs évolutions structurent le data engineering AWS en 2026. Apache Iceberg s’est imposé comme format de table standard du lakehouse, supporté nativement par Glue, Athena, EMR et Redshift. La gouvernance data via AWS Lake Formation est devenue centrale pour les organisations régulées (finance, santé, public). Le streaming temps réel via Kinesis et MSK (Managed Streaming for Kafka) gagne en adoption pour les cas d’usage temps quasi réel. L’intégration data + IA s’industrialise via SageMaker, Bedrock (modèles fondation) et les vector databases (OpenSearch, RDS pgvector). La FinOps data est un sujet sensible (coûts Athena, Redshift, EMR) intégré aux pratiques data engineering. Enfin, la convergence Spark + SQL + Python sous une seule plateforme (lakehouse) simplifie les architectures.

Sessions AWS Data Engineering à Genève, Lausanne et en virtuel

Nos sessions AWS Data Engineering sont planifiées à Genève, Lausanne et en classe virtuelle interactive avec un formateur en direct. Le format est très orienté pratique sur un environnement AWS réel. Les modalités matérielles vous sont communiquées en amont par notre équipe pédagogique. Pour les équipes data qui souhaitent une montée en compétence groupée sur leur architecture AWS réelle, nous organisons des sessions intra-entreprise calibrées sur votre stack (Glue jobs, Redshift cluster, Athena, Lake Formation, gouvernance fines).

FAQ AWS Data Engineering à ITTA

Faut-il connaître Python avant cette formation ?

Une culture Python aide pour les jobs Glue PySpark et les notebooks EMR. La formation reste accessible avec un niveau Python débutant à intermédiaire. Un parcours Python data en amont est conseillé pour les profils sans expérience préalable.

Redshift ou Athena pour démarrer ?

Athena est serverless et économique pour des requêtes ad hoc sur S3. Redshift est un data warehouse managé adapté aux charges BI à fort volume avec des requêtes complexes répétées. Le choix dépend des cas d’usage. Notre formation aborde ces arbitrages.

La formation prépare-t-elle la certification DEA-C01 ?

La formation Building Batch Data Analytics est une brique importante pour la certification AWS Certified Data Engineer Associate (DEA-C01), mais elle ne couvre pas l’ensemble des domaines de l’examen. Pour la préparation complète DEA-C01, des sessions complémentaires (streaming Kinesis, orchestration Step Functions, sécurité data fine) sont à prévoir.

AWS vs Databricks pour un nouveau projet data ?

AWS natif est pertinent pour les équipes déjà ancrées AWS et qui veulent une intégration native. Databricks apporte une expérience lakehouse unifiée plus aboutie pour les projets data + IA exigeants. Notre formation aborde honnêtement ces arbitrages.

Pourquoi se former à AWS Data Engineering chez ITTA

ITTA propose un catalogue AWS cohérent allant des fondamentaux (Cloud Practitioner CLF-C02) aux certifications Associate (Solutions Architect, Developer, SysOps, Data Engineer DEA-C01), Professional et Specialty. Cette continuité permet d’aborder une trajectoire data complète, depuis les fondamentaux AWS jusqu’aux spécialisations data engineering et IA. Nos formateurs AWS Data sont des data engineers et architectes en activité sur des projets AWS data en Suisse romande, ce qui leur permet d’apporter des exemples concrets et actuels. Sessions disponibles à Genève, Lausanne et en classe virtuelle interactive, en intra et inter-entreprise.