Language

Etes-vous data-centric ? Découvrez votre niveau de maturité data et profitez de recommandations d'experts

Faites le test
Glossaire

Data mesh

Le Data mesh est une approche décentralisée et fédérée de la gestion des données qui permet le partage et la démocratisation des données dans toute l'organisation.

Qu’est-ce que le Data mesh ?

Le concept de Data mesh désigne une architecture de données d’entreprise basée sur une approche distribuée et décentralisée de la gestion et du partage des données.

Il est conçu pour accroître l’utilisation des données dans l’ensemble de l’organisation, permettant aux entreprises de s’axer sur les données en accélérant la mise à l’échelle, le partage et la création de services data. Le Data mesh soutient donc des stratégies visant à assurer la démocratisation des données.

Le concept a été initialement proposé par Zhamak Dehghani du cabinet de conseil Thoughtworks en 2019, et a depuis été développé et adopté par plusieurs organisations.

Contrairement aux architectures de données précédentes, le Data mesh se focalise sur l’organisation elle-même, plutôt que sur la technologie. Il cherche à décentraliser les responsabilités liées aux données en les imputant à ceux qui en sont les plus proches. Une gouvernance commune est bien sûr conservée à l’échelon de toute l’entreprise et sur des normes de métadonnées pour garantir l’interopérabilité. L’architecture est mise en œuvre par une infrastructure de données partagée en libre-service.

Il s’agit essentiellement d’un modèle fédéré, un peu comme les États-Unis d’Amérique, avec un gouvernement central partiel, le pouvoir et la responsabilité étant néanmoins détenus par ceux qui sont les plus proches des citoyens : les États.

Quels sont les principes du Data mesh ?

Contrairement aux data warehouse ou data lakehouse, le Data mesh n’est pas un outil ou une technologie spécifique. Il s’agit plutôt d’un ensemble de principes qui définissent la manière dont les entreprises gouvernent, travaillent et partagent les données au sein de l’organisation.

Il repose sur quatre principes clés :

  1. Propriété des données : plutôt qu’une équipe centrale, les données appartiennent à ceux qui en sont les plus proches, comme ceux qui les créent. Les responsables sont chargés de s’assurer que les données sont disponibles, fiables, sécurisées, interopérables et compréhensibles par tous.
  2. Les données en tant que produit : pour être partageables, les données sont pensées sous formes de produit et permettent donc de résoudre les problèmes.
  3. Plateforme de données libre-service : les données doivent être accessibles à tous via le libre-service, afin qu’elles puissent être consultées facilement sans nécessiter de support supplémentaire.
  4. Gouvernance informatique fédérée : les normes de gouvernance des données et de métadonnées sont convenues et gérées de manière centralisée pour garantir l’interopérabilité, la cohérence et la sécurité.

Quels sont les avantages du Data mesh ?

Les organisations veulent pouvoir partager des données en interne pour améliorer la prise de décision, accroître la transparence et stimuler l’innovation. C’est ce que permet le Data mesh grâce à :

  • Un accès plus rapide à des produits de données compréhensibles par l’ensemble de l’entreprise
  • Un développement plus simple et plus rapide des services data grâce à des équipes indépendantes et responsables de leurs propres données
  • Une plus grande réutilisabilité avec des équipes qui partagent des processus et apprennent les unes des autres, obtenant des résultats plus rapides avec moins de ressources.
  • Un langage et un vocabulaire communs autour des données qui sont partagés par l’ensemble de l’entreprise, garantissant une cohérence et une compréhension commune.
  • Une gouvernance centralisée qui garantit des normes communes en matière de sécurité et de métadonnées, ce qui signifie que les besoins de conformité réglementaire sont satisfaits.
  • Une plus grande flexibilité en matière d’outils car les équipes peuvent utiliser l’outil le mieux adapté à leurs besoins, ce qui leur donne de l’indépendance et augmente leur adhésion au programme.
  • Des équipes responsabilisées et considérées comme des experts du domaine, leur expertise étant valorisée, stimulant davantage l’engagement et maximisant l’utilisation des ressources.

En quoi le Data mesh diffère-t-il des autres méthodologies de gestion des données ?

Il existe deux principales différences entre le Data mesh et les autres méthodologies de gestion des données :

  • Les données ne sont pas centralisées (comme dans un data lake). Les propriétaires des données sont répartis dans toute l’organisation, soutenus par une gouvernance centralisée.
  • Le Data mesh n’est pas une technologie spécifique puisque tous les outils existants sont compatibles avec le maillage de données. Cela signifie que les entreprises peuvent commencer par leur stratégie et leurs objectifs, puis déployer les bons outils pour répondre à leurs besoins. Cela évite le risque que des projets échouent, prennent trop de temps à être mis en œuvre ou ne produisent pas suffisamment de résultats.

Comment adopter le Data mesh ?

Contrairement aux projets de données traditionnels, le Data mesh repose moins sur la technologie et davantage sur la mise en œuvre d’une approche axée sur les données dans toute l’organisation. Cela peut conduire à trois défis principaux :

  • Construire une culture des données commune en éliminant les silos et en procédant à une gestion approfondie du changement dans l’ensemble de l’organisation. Cela demande un investissement en temps et en ressources.
  • Instaurer des règles communes concernant la gouvernance des données dans tous les départements. Cela nécessite un engagement et une adhésion de toutes les équipes.
  • Adopter une approche stratégique qui identifie les problèmes à résoudre en premier, plutôt que de simplement adopter une technologie.

Demandez une démo de la solution Opendatasoft et créez les meilleures expériences data

En savoir plus
Agence ORE : un portail unique pour les données d’énergie Énergie & Utilities
Agence ORE : un portail unique pour les données d’énergie

Pour être véritablement utiles, les données d’énergie doivent être exhaustives et facilement réutilisables dans l’écosystème. Découvrez comment l’Agence ORE répond à ce besoin grâce à son portail unifié de données.

Gouvernance des données vs data management : quelles sont les principales différences ? Accès aux données
Gouvernance des données vs data management : quelles sont les principales différences ?

Pour maximiser la valeur de leurs données, les organisations se concentrent à la fois sur la gouvernance des données et sur le data management. Il n'est pas rare de confondre ces concepts qui sont étroitement liés.

Le rôle central de la data dans la préparation des Jeux Olympiques et Paralympiques de Paris 2024 Actualités
Le rôle central de la data dans la préparation des Jeux Olympiques et Paralympiques de Paris 2024

À l'approche du plus grand rendez-vous sportif mondial, les Jeux Olympiques et Paralympiques de Paris 2024, l'utilisation stratégique des données s’est avérée cruciale pour la préparation de cette manifestation sportive exceptionnelle. Un webinaire récent, organisé par les équipes d’Opendatasoft, a réuni des experts de la data et du sport engagés dans les préparatifs pour discuter de l'impact profond de la data sur la planification, la gestion et l'optimisation de l’événement.

Commencez à créer vos expériences data