Article
Comment passer d'un Data Lab à une Data Factory ?
Les projets data, c’est comme les bébés tortues. Il en éclot un grand nombre mais peu arrivent à maturité. La plupart ne franchit pas le stade du POC (Proof Of Concept). Dans ce billet, nous allons voir comment faire passer facilement et rapidement ces projets du Data Lab, où ils naissent, à la Data Factory, où ils entrent en production.
Pour commencer, posons quelques définitions. Un projet data, c’est un projet où la connaissance et l’analyse de la donnée apparaissent comme les moyens pressentis pour résoudre un problème ou améliorer une situation.
Un Data Lab, c‘est quoi ?
Le Data Lab est le lieu où se construit le projet data. Là où s’élabore la recette, en quelque sorte. À l’instar des projets d’innovation, et contrairement aux projets informatiques classiques, un projet data se caractérise, en effet, par le fait qu’on ne connaît pas à l’avance le meilleur procédé pour atteindre l’objectif. Un projet data commence donc par une phase d’exploration servant à tester des modèles et à valider le potentiel de création de valeur. Au cours de cette phase exploratoire, l’Ingénieur Data et l’Analyste Data construisent, préparent et affinent le jeu de données sur lequel le Data Scientist s’appuie pour tester différents algorithmes et élaborer le modèle qui sera utilisé finalement.
Prenons l’exemple de la lutte contre l’attrition. La problématique d’une équipe marketing concernée par ce phénomène est d’identifier les clients sur le point de quitter la marque pour leur proposer des offres ou des conditions qui vont les retenir. L’équipe marketing se tourne vers le Data Lab de son entreprise et lui demande de l’aider à prédire les clients susceptibles de partir. Le Data Lab explore différentes pistes. Par sa connaissance approfondie de son domaine et de ses clients, l’équipe marketing le guide dans la construction du bon jeu de données et la validation des résultats obtenus.
Une Data Factory, c‘est quoi ?
Une fois la recette élaborée, le projet – alors, au stade de maquette - doit être industrialisé pour être mis en production. Il s’agit d’automatiser l’exécution de la chaîne de processus qui font tourner le service au quotidien : le versement des données dans le système, le stockage de l’information, le traitement par les algorithmes et, enfin, l’exposition des résultats. C’est le rôle de la Data Factory de mettre en place cette plateforme d’automatisation. Elle mobilise essentiellement l’ingénieur data, qui travaille avec les spécialistes des tests informatiques et de l’automatisation, et le métier, qui fait le choix du mode d’exposition. Ce sera, selon la finalité du projet, des flux d’informations et des workflows d’actions, des interfaces de programmation (API) ou des outils de datavisualisation, par exemple.
Bien souvent, les environnement mis en œuvre par les Data Labs et par les Data Factories sont tellement éloignés que l’industrialisation demande de reconstruire entièrement le service et son infrastructure pour l’adapter à la chaîne de production en place. Et c’est là que le bât blesse : l’industrialisation, à la façon et avec les outils et infrastructures d’hier, est un processus lent…, trop lent au regard des attentes du métier, qui, de guerre lasse, finit par abandonner le projet...
Cloud et collaborative first
Mais il n’y a pas de fatalités. Aujourd’hui, des approches et des outils aident à réduire le hiatus. Travailler dans le cloud, par exemple, permet de disposer des mêmes ressources que l’on se trouve dans le Data Lab ou dans la Data Factory. Il devient ainsi possible de concevoir l’environnement de production en harmonie avec l’environnement utilisé par le Data Lab. Et, cela, très en amont de l’industrialisation à proprement parler. Ce qui facilite le passage d’un état à l’autre. Au final, l’industrialisation se résume à effectuer l’ordonnancement des processus.
Moyennant cela, et à la condition indispensable que les composantes techniques et métier travaillent en étroite collaboration pendant toute la durée du cycle, le délai d’industrialisation peut passer de plusieurs semaines à quelques jours… Le constat est sans appel !
Aborder ses projets data avec une démarche cloud et collaborative est une garantie de succès. Et l’expérience montre que la création de valeur est souvent au rendez-vous. À vous, donc, d’identifier la problématique à résoudre. À nous de vous accompagner pour un passage du Data Lab à la Data Factory, fluide et rapide.