Data Scientist VS Data Engineer


Actualité publiée le 26 juillet 2022

L’explosion du Big Data et son utilisation dans la business intelligence ont eu pour effet positif de développer de nouveaux métiers, liés au digital et au traitement des données. Parmi eux, les Data Scientists et Data Engineers. Que valent ces deux professions et vers laquelle s’orienter au titre d’un parcours supérieur en ingénierie informatique ?

 

Le Data Scientist sur le devant de la scène

Le métier de Data Sientist a été nommé « métier le plus sexy de notre siècle » par la Harvard Business Review en 2012, ce qui a eu pour effet de mettre la profession sous les feux des projecteurs.

 

Le Data Scientist est un analyste de haut vol, qui convertit des données brutes en idées précises, applicables dans le domaine de l’industrie (ou de l’économie) dans lequel il évolue. Grâce aux modèles statistiques qu’il utilise et à sa connaissance pointue du Machine Learning, il résout des problèmes business jusqu’ici insolvables.

 

C’est donc un analyste des données doublé d’un excellent informaticien. Le Data Scientist connaît en effet la programmation, la modélisation algorithmique et le traitement des Data à très grand volume. En effet, afin de développer des modèles de Machine Learning suffisamment performants pour apporter de la valeur ajoutée à son entreprise, le Data Scientist maîtrise la programmation statistique (avec Panda en tête) et les langages de programmation des experts, à l’instar de Python ou R. Jupyter.

 

L’engouement pour le métier rend la profession riche et, parfois, difficile à intégrer. Pour être un bon Data Scientist, il faut savoir gérer les nouvelles technologies, qui se renouvellent tous les cinq ans, démontrer de solides compétences d’informaticien et de statisticien et faire preuve d’une véritable compréhension métier. C’est notamment ce qui explique la rémunération très attractive d’un poste de Data Scientist : entre 40 et 50 KE en début de carrière (et en île de France) et parfois plus de 80 000 euros pour un Data Scientist Senior.

 

 

Data Engineer : le point de départ

Le rôle principal du Data Engineer, c’est de créer des architectures modèles afin d’acquérir, de stocker et d’analyser un flux colossal de données. Il doit définir la manière dont les données sont intégrées au système de stockage de l’entreprise et transformées afin qu’elles soient analysables : c’est le ETL (pour Extract, Transfoorm and Load).

 

C’est lui qui est le point de départ de toute exploitation des données, en fournissant la solution afin d’extraire les informations brutes du flux du Big Dtaa et de les conserver de manière viable et sécurisée. Si le traitement des Data était une maison, ce serait le Data Engineer qui en construirait les murs et les canalisations et qui assurerait sa viabilisation et ses raccords en eau et en électricité !

 

En pratique, le Data Engineer va développer, entretenir et tester son architecture (bases de données comme systèmes de traitement à grande échelle) afin d’assurer un flux constant d’infirmations destiné aux équipes de Data Scientist.

 

 

Data Scientists et Data Engineers : des rôles complémentaires

Il est difficile d’opposer radicalement les professions de Data Scientists et Data Engineers tant elles sont intriquées dans l’obtention des résultats des analyses de données. En effet, pour que le Data Scientist puisse construire des modèles autour des données collectées (et les exploiter plus efficacement), il doit se baser sur un environnement numérique propre à accueillir et structurer ces informations dématérialisées.

 

En somme, c’est le Data Engineer qui construit les architectures logicielles nécessaires afin de collecter et de traiter les données à très grandes échelle. Il construit la pipeline qui est transférée au Data Scientist afin de lui permettre de mettre ses modèles en action, grâce au flux continu instauré entre les serveurs et les applications. Sans cette base, le Data Scientist n’est pas en mesure de travailler de manière optimale et ne peut pas traiter les informations.

 

Le rôle du Data Engineer est donc crucial, c’est lui qui soutient toutes les architectures capables de tirer de la modélisation des données des objectifs stratégiques concrets qui représentent de la valeur pour son entreprise. Il est donc indispensable à l’exploitation du Big Data, ce qui explique que sa rémunération soit très élevée. En début de carrière, un jeune Data Engineer peut gagner près de 40 000 euros annuels et jusque 80 000 euros après quelques années d’expérience.

 

 

Data Scientists et Data Engineers : qu’en est-il des débouchés ?

Les grands groupes de l’industrie et de l’économie française font état d’un cruel manque d’analystes et d’architectes faisant preuve de compétences techniques de niveau suffisant ainsi que d’une véritable connaissance du monde de l’entreprise. Une étude menée par la Mission numérique gouvernementale auprès de 81 groupes français issus du CAC 40 met en lumière le manque de professionnels qualifiés démontant de véritables connaissances métier.

 

Pour les multinationales, les compétences des Data Scientists et des Data Engineers sont cruciales pour définir une stratégie marketing, commerciale et de publicité au niveau international. La demande est donc supérieure à l’offre et les recruteurs des grands groupes de l’Hexagone soulignent leur besoin de recruter des métiers techniques dans la data : Data Engineers, mais aussi data architects ou data officiers.

 

Le procédé de l’upskilling (augmenter les compétences des informaticiens en poste afin de garantir la continuation de leur métier) n’est pas suffisant aux yeux des recruteurs, en raison des compétences hautement techniques requises par la maîtrise et l’exploitation du Big Data.

 

Les professionnels indiquent donc rechercher prioritairement des étudiants sortants des grandes écoles de l’ingénierie informatique qui ont bénéficié d’un cursus en alternance. En effet, cette modalité d’apprentissage leur garantit que le candidat dispose effectivement de compétences en lien avec le monde de l’entreprise. Son expérience professionnelle est donc vivement appréciée et est un facteur déterminant l’embauche dans les métiers de Data Scientists et Data Engineers.

 

C’est pour répondre aux besoins des professionnels et des recruteurs du secteur que l’ESGI propose ses cursus de haut niveau académique en alternance. L’établissement forme des Data Scientists et des Data Engineers qui trouvent rapidement un emploi à l’issue de leur formation.

 

 

Les Data Scientists et les Data Engineers travaillent conjointement et au sein d’équipes spécialisées dans le traitement et dans l’exploitation du Big 

200