Toute la pile de données devient plus modulaire. Il faut maintenant quelqu’un pour la coordonner.
L’infrastructure de données moderne a en grande partie résolu les enjeux d’exécution. Le stockage se standardise autour de formats de tables ouverts, et les moteurs de requête deviennent de plus en plus modulaires et interchangeables. Par conséquent, les défis les plus complexes se déplacent : il ne s’agit plus seulement d’exécuter des charges de travail, mais de coordonner l’évolution de l’état des données à travers les systèmes, les flux de travail et les utilisateurs.
Le changement le plus marquant dans l’évolution des produits et des flux de travail est que la donnée est passée d’un simple artefact d’analyse à un élément central des systèmes en production. Elle ne sert plus uniquement à l’analytique : elle alimente désormais des logiciels en production, des systèmes d’IA et des fonctionnalités directement exposées aux utilisateurs. Cette convergence rapproche de plus en plus l’ingénierie des données et l’ingénierie logicielle autour d’un runtime et d’un modèle de responsabilité partagés. La question n’est donc plus comment la donnée est exécutée, mais plutôt qui contrôle et gère l’état des données dont tout dépend.
Nous avons cherché à explorer l’évolution de la pile de données, les défis de coordination qui émergent avec des systèmes modulaires, ainsi que les segments d’infrastructure qui nous semblent les plus intéressants pour la suite.
Merci à tous les opérateurs et fondateurs qui ont partagé leur feedback et leurs perspectives au fil de cette réflexion. Nous serions également ravis d’avoir votre point de vue. Si vous bâtissez dans cet espace ou réfléchissez à des problématiques similaires, n’hésitez pas à contacter Taha Mubashir et/ou Ayush Malhotra.
INSIGHTS SUR L’INDUSTRIE
La prochaine couche de la pile de données : coordonner l’état des données (rapport en anglais)