Language

Etes-vous data-centric ? Découvrez votre niveau de maturité data et profitez de recommandations d'experts

Faites le test
Glossaire

Data mesh

Le Data mesh est une approche décentralisée et fédérée de la gestion des données qui permet le partage et la démocratisation des données dans toute l'organisation.

Qu’est-ce que le Data mesh ?

Le concept de Data mesh désigne une architecture de données d’entreprise basée sur une approche distribuée et décentralisée de la gestion et du partage des données.

Il est conçu pour accroître l’utilisation des données dans l’ensemble de l’organisation, permettant aux entreprises de s’axer sur les données en accélérant la mise à l’échelle, le partage et la création de services data. Le Data mesh soutient donc des stratégies visant à assurer la démocratisation des données.

Le concept a été initialement proposé par Zhamak Dehghani du cabinet de conseil Thoughtworks en 2019, et a depuis été développé et adopté par plusieurs organisations.

Contrairement aux architectures de données précédentes, le Data mesh se focalise sur l’organisation elle-même, plutôt que sur la technologie. Il cherche à décentraliser les responsabilités liées aux données en les imputant à ceux qui en sont les plus proches. Une gouvernance commune est bien sûr conservée à l’échelon de toute l’entreprise et sur des normes de métadonnées pour garantir l’interopérabilité. L’architecture est mise en œuvre par une infrastructure de données partagée en libre-service.

Il s’agit essentiellement d’un modèle fédéré, un peu comme les États-Unis d’Amérique, avec un gouvernement central partiel, le pouvoir et la responsabilité étant néanmoins détenus par ceux qui sont les plus proches des citoyens : les États.

Quels sont les principes du Data mesh ?

Contrairement aux data warehouse ou data lakehouse, le Data mesh n’est pas un outil ou une technologie spécifique. Il s’agit plutôt d’un ensemble de principes qui définissent la manière dont les entreprises gouvernent, travaillent et partagent les données au sein de l’organisation.

Il repose sur quatre principes clés :

  1. Propriété des données : plutôt qu’une équipe centrale, les données appartiennent à ceux qui en sont les plus proches, comme ceux qui les créent. Les responsables sont chargés de s’assurer que les données sont disponibles, fiables, sécurisées, interopérables et compréhensibles par tous.
  2. Les données en tant que produit : pour être partageables, les données sont pensées sous formes de produit et permettent donc de résoudre les problèmes.
  3. Plateforme de données libre-service : les données doivent être accessibles à tous via le libre-service, afin qu’elles puissent être consultées facilement sans nécessiter de support supplémentaire.
  4. Gouvernance informatique fédérée : les normes de gouvernance des données et de métadonnées sont convenues et gérées de manière centralisée pour garantir l’interopérabilité, la cohérence et la sécurité.

Quels sont les avantages du Data mesh ?

Les organisations veulent pouvoir partager des données en interne pour améliorer la prise de décision, accroître la transparence et stimuler l’innovation. C’est ce que permet le Data mesh grâce à :

  • Un accès plus rapide à des produits de données compréhensibles par l’ensemble de l’entreprise
  • Un développement plus simple et plus rapide des services data grâce à des équipes indépendantes et responsables de leurs propres données
  • Une plus grande réutilisabilité avec des équipes qui partagent des processus et apprennent les unes des autres, obtenant des résultats plus rapides avec moins de ressources.
  • Un langage et un vocabulaire communs autour des données qui sont partagés par l’ensemble de l’entreprise, garantissant une cohérence et une compréhension commune.
  • Une gouvernance centralisée qui garantit des normes communes en matière de sécurité et de métadonnées, ce qui signifie que les besoins de conformité réglementaire sont satisfaits.
  • Une plus grande flexibilité en matière d’outils car les équipes peuvent utiliser l’outil le mieux adapté à leurs besoins, ce qui leur donne de l’indépendance et augmente leur adhésion au programme.
  • Des équipes responsabilisées et considérées comme des experts du domaine, leur expertise étant valorisée, stimulant davantage l’engagement et maximisant l’utilisation des ressources.

En quoi le Data mesh diffère-t-il des autres méthodologies de gestion des données ?

Il existe deux principales différences entre le Data mesh et les autres méthodologies de gestion des données :

  • Les données ne sont pas centralisées (comme dans un data lake). Les propriétaires des données sont répartis dans toute l’organisation, soutenus par une gouvernance centralisée.
  • Le Data mesh n’est pas une technologie spécifique puisque tous les outils existants sont compatibles avec le maillage de données. Cela signifie que les entreprises peuvent commencer par leur stratégie et leurs objectifs, puis déployer les bons outils pour répondre à leurs besoins. Cela évite le risque que des projets échouent, prennent trop de temps à être mis en œuvre ou ne produisent pas suffisamment de résultats.

Comment adopter le Data mesh ?

Contrairement aux projets de données traditionnels, le Data mesh repose moins sur la technologie et davantage sur la mise en œuvre d’une approche axée sur les données dans toute l’organisation. Cela peut conduire à trois défis principaux :

  • Construire une culture des données commune en éliminant les silos et en procédant à une gestion approfondie du changement dans l’ensemble de l’organisation. Cela demande un investissement en temps et en ressources.
  • Instaurer des règles communes concernant la gouvernance des données dans tous les départements. Cela nécessite un engagement et une adhésion de toutes les équipes.
  • Adopter une approche stratégique qui identifie les problèmes à résoudre en premier, plutôt que de simplement adopter une technologie.

Demandez une démo de la solution Opendatasoft et créez les meilleures expériences data

En savoir plus
Tout ce qu’il faut savoir sur l’enrichissement des données Transformation numérique
Tout ce qu’il faut savoir sur l’enrichissement des données

L'enrichissement des données (ou data enrichment) est essentiel pour transformer vos données brutes en informations précieuses qui peuvent être facilement comprises et utilisées en interne et en externe. Notre blog explique comment mettre en œuvre avec succès l'enrichissement des données dans votre entreprise afin d'améliorer la qualité, la cohérence et la standardisation pour maximiser la valeur.

Portail de données : pourquoi acheter une solution SaaS plutôt que développer en interne (in-house) ? Tendances
Portail de données : pourquoi acheter une solution SaaS plutôt que développer en interne (in-house) ?

Déployer un portail de données centralisé vous semble à la portée de vos équipes ? Vous risquez de créer une solution inadaptée qui ne répond ni aux besoins des utilisateurs, ni à ceux de votre entreprise. Découvrez dans cet article de blog pourquoi le choix d’un fournisseur SaaS indépendant est la meilleure option, et les critères à rechercher chez un partenaire.

Intégration des modèles LLM de Mistral AI pour une IA souveraine et une approche multi-modèles adaptée aux besoins de nos clients Produit
Intégration des modèles LLM de Mistral AI pour une IA souveraine et une approche multi-modèles adaptée aux besoins de nos clients

Pour répondre aux enjeux de souveraineté de nos clients et leur permettre de tirer parti des fonctionnalités optimisées par l'IA, notre solution de portail de données Opendatasoft s’appuie désormais sur l'IA générative de MistralAI, en complément de celle d'OpenAI déjà déployée en 2023. Notre approche “multi-modèles” présente de nombreuses vertus pour nos clients et leurs consommateurs data comme pour nos équipes R&D et notre innovation future.

Commencez à créer vos expériences data