Formation
Data / IA

Data Engineer

Vous souhaitez devenir Data Engineer ?
Formez vous avec Simplon pour accéder à ce métier phare de la data et booster votre carrière dans la Tech.
Formation de 3 mois à temps plein, suivie de 18 mois en alternance.

Candidater

Certification RNCP  Bac +5

18 mois en alternance

Sur campus ou à distance

100% financée

Data Engineer, un métier émergent d’expert de la Data  

Le Data Engineer est un ingénieur spécialisé dans la conception de solutions répondant à un besoin de stockage, d’organisation, d’accession, d’agrégation, de protection et d’analyse de données. Ce besoin découle de la massification récente des données disponibles, phénomène désigné sous le nom de big data. Il vient se positionner entre les administrateurs IT (technologies de l’information) qui fournissent une infrastructure IT opérationnelle et les data analysts/scientists qui vont exploiter les données.

Premier acteur du processus de traitement de la donnée, son travail intervient en amont de l’exploitation des données (data analysts/scientists), directement après que l’infrastructure technique a été mise en œuvre par les architectes et les administrateurs. La finalité de l’expert en ingénierie de données massives et intelligence artificielle est de rendre les données faciles d‘accès et prêtes à l’analyse par ses clients internes (notamment les data analysts/scientists).

Sa mission principale est la création des flux de collecte, de nettoyage et de stockage des données, notamment par l'automatisation de la récupération massive de données via des API et des techniques de crawling et de scraping.

En fonction de la taille de l’entreprise et des données à manipuler, il structure et alimente une base de données analytique, un data warehouse ou encore un data lake en administrant des SGBD avancés et des technologies de distribution des calculs. Il déploie et optimise ces infrastructures ainsi que des pipelines de données sécurisés sur des solutions cloud pour assurer une scalabilité dynamique et le traitement en temps réel.

Le métier d'expert en ingénierie de données massives et intelligence artificielle s’articule alors autour de 5 blocs d’activité :
- Définir la stratégie du projet en ingénierie de données massives et/ou IA
- Manager un projet en ingénierie de données massives et/ou IA
- Assurer la gouvernance, gestion des risques et de la conformité d’un projet en ingénierie de données massives et IA
- Concevoir et déployer des infrastructures de donnéesDévelopper des solutions data et IA

Le programme de formation
fondé sur la pédagogie Simplon

Introduction à la formation

Durant les premières semaines, découvrez les grandes lignes de votre futur métier, expérimentez la pédagogie active de Simplon et faites connaissance avec votre promotion. Très vite, vous aurez une vision claire des compétences à acquérir et des critères sur lesquels vous serez évalué pour l'obtention de la certification finale.

Durant la formation, vous appréhendez des langages de programmation comme Python, Java ou Scala, ainsi que les outils Big Data tels que Hadoop, Spark et SQL. Vous acquerrez également des connaissances en architecture distribuée et en  cloud computing.

Phase 0

Vous : Prenez en main les outils de l’expert en ingénierie de données massives et intelligence artificielle(70h)

Vous découvrez les différentes activités du métier d’expert en ingénierie de données massives et intelligence artificielle.

Vous faites évoluer un script de collecte et d’agrégation de données.

Vous corrigez un bug dans l’exécution d’un script de collecte et d’agrégation de données.

Phase 1

Vous intervenez sur des ETL et des bases de données et les faites évoluer (70h).

Vous mettez à jour la procédure d’ETL vers un Datamart.

Vous pilotez et réalisez la mise à jour d’un contrat d’interface.

Vous créez une base de données Open Data à partir d'un Data Warehouse existant.

Phase 2

Vous intervenez sur une infrastructure Data et la faites évoluer (140h).

Vous intégrez de nouveaux jeux de données à un data warehouse.

Vous effectuez une EDA des données.

Vous ajoutez un nouveau pays dans un data warehouse.

Vous connectez un data lake existant à de nouvelles sources de données en respectant le RGPD.

Vous augmentez une nouvelle fois la capacité de stockage du data lake.

Vous paramétrez les accès au data lake pour une équipe qui en fait la demande.

Vous mettez en place le monitorage d’une infrastructure et proposez une amélioration.

Vous mettez à jour un tableau de bord.

Phase 3

Vous concevez et créez un data warehouse (70h).

Vous transposez des analyses et/ou visualisations dans une nouvelle plateforme cloud.

Vous créez de nouveaux flux de données pour une nouvelle demande métier.

Vous optimisez l'orchestration des flux de transformation de données sur l’ensemble de la chaîne de traitement.

Vous modifiez les hyperparamètres d'un modèle de ML pour améliorer ses performances.

Vous utilisez les données d'un modèle de ML pour alimenter un tableau de bord.

Phase 4

Vous concevez et créez un data warehouse (70h)

Vous concevez un data warehouse à partir de la cartographie des données de l'organisation.

Vous améliorez la qualité de données issues d’un flux de traitement existant.

Vous organisez et mettez en œuvre la migration de données depuis une solution On Premise vers le Cloud.

Vous mettez en place le monitorage d’une infrastructure et proposez une amélioration.

Vous accompagnez la réponse à un besoin Data.

Phase 5

Vous concevez et créez un data lake (70h)

Vous concevez et créez un data lake à l'échelle d'une organisation.

Vous mettez en place une démarche DataOps au sein de l'entreprise pour la gestion des flux de données.

Vous concevez et mettez en place une collecte de données massives.

Vous élargissez l’accès au data lake.

Vous accompagnez la réponse à un besoin Data.

Phase 6

Vous développez des solutions IA pour l'aide à la décision (70h)

Vous réalisez une analyse statistique avancée des données.

Vous choisissez l'algorithme adapté, entraînez des réseaux de neurones et traitez des données textuelles.

Vous intégrez le modèle d'IA dans un pipeline automatisé sur le Cloud.

Vous vous assurez que l'IA ne comporte pas de biais, respectez le RGPD et justifiez le ROI.

Vous créez un tableau de bord décisionnel intégrant des données fournies par un modèle de Deep Learning.

Phase 7

Vous vous préparez à l’examen de certification et clôturez le parcours de formation (70h)

Vous passez en revue les livrables techniques et les documents attendus pour la certification.

Vous passez en revue la présentation pour la soutenance.

Vous vous entraînez avec un examen blanc.

Les pré-requis
et conditions
pour nous rejoindre

Afin d'intégrer le dispositif de formation ou pour suivre une formation, vous devez :
 soit être titulaire d’un titre ou d’un diplôme de niveau 5 en informatique avec une expérience professionnelle de 2 années minimum dans le secteur des systèmes et réseaux informatiques. Soit être titulaire d’un titre ou d’un diplôme de niveau 6 en informatique. Dans le cas où un candidat ne disposerait pas des prérequis définis, il a la possibilité de déposer un dossier de candidature qui sera examiné par une commission en vue d’une admission « exceptionnelle ».

Votre état d’esprit

Une très forte motivation, à démontrer lors de la candidature

Curieux et créatif, avec un bonne capacité d’expression à l’oral
et à l’écrit

Prêt à travailler en équipe et à collaborer autour de projets

La volonté de vous investir dans la durée dans un parcours de formation intense

Votre niveau de maîtrise technique

Cette formation s’adresse en priorité à des personnes disposant, par le diplôme ou l’expérience professionnelle de compétences en gestion de projet : identification des besoins, rédaction technique, suivi du planning, liaison client-équipes

De compétences techniques telles que installation et gestion de services, programmation de scripts d'automatisation sous Linux, conception de bases de données, maîtrise de SQL et manipulation de données pour qualification, programmation (PHP, Python, Java)

D’une maîtrise de l’anglais technique

Handicap

Si vous êtes en situation de handicap, il est possible de mettre en place des aménagements.

Rejoignez une prochaine session

Prêt à vous lancer ? Voici un aperçu des sessions ouvertes à la candidature.

Alternance
Pictogramme Filière Data / IA
Data / IA
6/29/2026
29
June
June 29, 2026
2026
/ Pré-inscription
Formation standard avec conditions particulières
Data / IA
Data Engineer

Data engineer

Auvergne-Rhône-Alpes
Bourg En Bresse
11 mois
11
false
Avancé
 -  
Bac +5
Alternance
Pictogramme Filière Data / IA
Data / IA
10/12/2026
12
October
October 12, 2026
2026
/ Pré-inscription
Formation standard
Data / IA
Data Engineer

Data Engineer – Wild Code School

A distance
A distance
18 mois
18
true
Avancé
 -  
Bac +5

Vous souhaitez suivre la formation Data Engineer en alternance ?


Simplon vous propose de réaliser cette formation à la Wild Code School, école du Groupe Simplon.


Profitez de l’expertise pédagogique de Simplon et de l’accompagnement de la Wild Code School pour suivre un parcours en alternance de 18 mois spécialisé en data & IA.

Les étapes
pour candidater

01
Prise de contact

Vous êtes intéressé par une session de formation ? Renseignez le formulaire de candidature

02
Dossier de candidature

Complétez soigneusement le dossier de candidature que vous recevrez par mail. Celui-ci peut inclure une phase d’auto-apprentissage ou la réalisation d’un mini-projet.

03
Sélection

Participez aux entretiens de sélection.

04
Recherche d'entreprise

Pour une formation en alternance, nous pouvons vous accompagner dans votre recherche d'entreprise.

05
Début de la formation

Rentrez en formation !

Visez des certifications reconnues

Certification
RNCP40167

Expert en ingénierie de données massives et intelligence artificielle

Certification
DP-700

Microsoft Fabric Data Engineer

Certification
DP - 900

Principes de base des données Microsoft Azure

Certification
DP -600

Implémentation de solutions d’analyse à l’aide de Microsoft Fabric

Certification
AZ-900

Principes fondamentaux Microsoft Azure

Les compétences que vous allez développer

Piloter la conduite d’un projet data au sein d’une organisation

Analyser l’expression d’un besoin de projet data dans une étude de faisabilité en explorant, à l’aune des enjeux stratégiques de l’organisation, le besoin métier avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques du projet avec le ou les commanditaire(s).

Cartographier les données disponibles en référençant les usages, les sources, les métadonnées et les données afin de valider les hypothèses techniques du projet data.

Concevoir un cadre technique d’exploitation des données en analysant les contraintes techniques, de moyens et la cartographie des données afin de définir une réponse technique adaptée aux ressources mobilisables dans le respect du RGPD et d’une démarche éco-responsable.

Réaliser une veille technique et réglementaire en sélectionnant des sources et en collectant et traitant les informations collectées afin de formuler des recommandations projet toujours en phase avec l’état de l’art.

Superviser la réalisation d’un projet data en organisant les méthodes, les outils de travail et la communication entre les parties prenantes, afin d’accompagner les membres de l’équipe dans la réussite du projet.

Communiquer tout au long de la réalisation du projet data sur les orientations, les réalisations et leurs impacts en élaborant la stratégie et les supports de communication afin d’informer toutes les parties prenantes des évolutions ou des opportunités internes comme externes, portés par le projet.

Réaliser la collecte, le stockage et la mise à disposition des données d’un projet data au sein d’une organisation

Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet.

Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet.

Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final.

Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet.

Partager le jeu de données en configurant des interfaces logicielles et en créant des interfaces programmables afin de mettre à disposition le jeu de données pour le développement du projet.

Élaborer et maintenir un entrepôt de données (data warehouse)

Modéliser la structure des données d’un entrepôt de données en s’appuyant sur les dimensions et les faits afin d’optimiser l’organisation des données pour les requêtes analytiques.

Créer un entrepôt de données à partir des paramètres du projet, des contraintes techniques et matérielles et de la modélisation de la structure des données afin de soutenir l’analyse de l’activité et l’aide à la décision stratégique de l’organisation.

Intégrer les ETL nécessaires en entrée et en sortie d’un entrepôt de données afin de garantir la qualité et le bon formatage des données en respectant les modélisations logiques et physiques préalablement établies.

Gérer l’entrepôt de données à l’aide des outils d’administration et de supervision dans le respect du RGPD, afin de garantir les bons accès, l’intégration des évolutions structurelles et son maintien en condition opérationnelle dans le temps.

Implémenter des variations dans les dimensions de l’entrepôt de données en appliquant la méthode adaptée en fonction du type de changement demandé afin d’historiser les évolutions de l’activité de l’organisation et maintenir ainsi une bonne capacité d’analyse.

Encadrer la collecte massive et la mise à disposition des données issues de l’activité de l’organisation grâce à un data lake

Concevoir l'architecture du data lake en sélectionnant les technologies appropriées en fonction de la volumétrie, de la variété et de la vitesse des données dans le but de définir l’architecture technique optimale à intégrer.

Intégrer les différents composants d'infrastructure du data lake en appliquant la procédure adaptée, afin d’assurer l’acquisition, le stockage et la mise à disposition du catalogue de données

Gérer le catalogue des données en tenant compte de leur nature, de leurs sources d’alimentation et de leur cycle de vie, dans le respect du RGPD, afin de garantir les fonctionnalités du service.

Implémenter les règles de gouvernance des données en sécurisant la recherche, la récupération et l’ajout de données afin de respecter les règles de gouvernance des données de l’organisation, dans le cadre du déploiement de la politique de protection des données.

Une formation de la filière DATA & IA

Avec Simplon, construisez un parcours de formation qui répond à vos objectifs.

Ils ont choisi Simplon

Découvrez le témoignage de nos alumni qui ont lancé leur carrière dans la tech avec Simplon.

"Les métiers du numérique m’ont tout de suite attirée : plus de possibilités, plus d’autonomie, un travail plus valorisé. J’ai adoré les méthodes d’enseignement, surtout après avoir arrêté les études pendant un moment."
Léna
Alumni, Simplon en Ile-de-France
"Avant Simplon, je n’avais pas d’idée de ce que je voulais faire. Aujourd'hui, je suis beaucoup plus sereine, j’ai enfin trouvé un domaine dans lequel je pourrai évoluer."
Julie
Alumni
"C’est dans le numérique que je voulais me reconvertir. Simplon m’a énormément aidé à apprendre toutes les bases car je n’avais pas de bagage dans le développement."
Stan
Développeur IA

Tout pour réussir

Nos formations sont accessibles à toutes et tous, le plus souvent sans pré-requis de diplôme et intégralement financées, pour que votre motivation soit le principal levier de réussite. Avec Simplon, vous avez toutes les clés pour vous permettre d’évoluer.

Des formations qui ciblent des compétences recherchées par les entreprises sur des métiers Tech porteurs

Une pédagogie active qui vous prépare au monde professionnel avec des mises en situation concrètes et des projets réalisés en équipe

Des compétences validées par des titres professionnels et des certifications reconnus par France Compétences

Un accompagnement personnalisé pour valoriser votre profil et donner un nouvel à votre carrière

Participez à un prochain évènement Simplon

Vous avez un projet de votre formation ? Rencontrez nos équipes pour en savoir plus sur les formations proposées par Simplon.

Des questions ?

Retrouvez ci-dessous les questions-réponses les plus fréquentes sur la formation.

Puis-je suivre plusieurs formations chez Simplon ?

Notre offre de formation est conçue dans une logique de parcours de formation. Les formations Découverte sont des portes d’entrée vers des formations professionnalisantes plus longues. A l’issue d’une formation, des suites de parcours vous permettent d’accéder à une certification de niveau supérieur ou de vous spécialiser. Vous pouvez également revenir après quelques années d’expérience professionnelle pour suivre une nouvelle formation chez Simplon.

Quelle est la durée d’une formation ?

Nos formations aux métiers du numérique, qu’elles soient à temps plein ou en alternance, se déroulent en général sur une durée de 3 à 18 mois. En amont, les formations Découverte de quelques semaines vous permettent de vous initier à un domaine et de confirmer votre projet professionnel avant de vous engager dans une formation plus longue.

Quelles sont les formations proposées par Simplon ?

Nos formations sont conçues pour être en phase avec les besoins des entreprises et vous aider à développer les compétences recherchées. Nous proposons des formations de Découverte du numérique et des formations professionnalisantes du niveau Bac au niveau Bac+5 en sortie. Quels que soient votre niveau de compétence actuel ou vos objectifs professionnels, n’hésitez pas à nous contacter pour que nous vous orientions vers la formation adaptée à votre profil.

Combien coûte une formation chez Simplon ?

Le coût horaire des formations incluant le passage de certifications, varie de 12 euros à 27 euros de l'heure (hors majoration ou modulation liée à un dispositif spécifique). Sous réserve d’éligibilité, selon votre profil, les formations sont intégralement financées en mobilisant les dispositifs de la formation professionnelle, sans aucun reste à charge pour vous.

Les formations sont-elles accessibles aux personnes en situation de handicap ?

Les formations Simplon sont ouvertes à toutes et tous, inclusives et adaptées aux personnes en situation de handicap. En fonction de vos besoins, vous pourrez bénéficier d'aménagements spécifiques : temps de pause adaptés, journées de télétravail ponctuelles, siège ergonomique… Le mieux est de nous en faire part dès la phase de candidature afin que nous puissions vous proposer une solution personnalisée.

Comment puis-je savoir quelle formation me conviendrait ?

Si vous envisagez une formation aux métiers de la tech, sans avoir encore de projet professionnel précis, nous vous encourageons à vous renseigner par vous-même en faisant des recherches sur le web ou en participant à des événements (conférences, masterclass, rencontres avec des professionnels). La capacité à être autonome et actif est une qualité que nous apprécions chez Simplon. Prenez également en compte votre disponibilité : au quotidien, nos formations impliquent 35 heures de présence par semaine, avec en plus un travail autonome sur des projets qui peut représenter quelques heures par semaine. dans la durée, nos parcours de formation impliquent un engagement de votre part de quelques semaines à 12 ou 18 mois.

Je souhaite en savoir plus sur les formations Simplon avant de candidater. Comment faire ?

Nous organisons différents événements où vous serez les bienvenus : réunions d'information en ligne, Journées Portes Ouvertes, ateliers d’initiation au code. C’est l’occasion de vous informer, de préciser votre projet de formation et de bénéficier de nos conseils pour vous orienter.

Vous souhaitez en savoir plus ?

Venez rencontrer nos équipes lors d’un prochain événement