Language

[Product Talk] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Je m'inscris
Services data

Quelle est la différence entre un data product et un data asset ?

What is the difference between a data product and a data asset?

Les organisations génèrent des volumes croissants de données, mais à elles seules, ces données brutes ne peuvent pas générer de valeur. Elles peuvent être difficiles à interpréter, au mauvais format ou simplement être trop basiques pour être utiles, c’est pourquoi il est plus que nécessaire aujourd’hui de transformer les données brutes en data assets (actifs de données) et en data products (produits de données) à valeur ajoutée et plus accessibles.

VP of Marketing, Opendatasoft
Voir tous ses articles

Mais quelles sont les différences entre les deux ? Et comment les intégrer dans une stratégie de données ?

Copy to clipboard

Un data asset ou actif de données est une entité numérique constituée de données qui offre une certaine valeur. Il peut s’agir d’un ensemble de données présenté sous forme de tableau, d’une visualisation de données (comme un tableau de bord) ou d’un service de données. En somme, l’actif de données est l’étape qui suit les données brutes, lesquelles ont été enrichies et organisées pour être comprises et utilisées. Par exemple : les données brutes d’un capteur qui prend des mesures toutes les minutes se présenteront simplement sous forme d’un grand tableau de chiffres. En les transformant en un tableau de bord interactif, en les reformatant et en les expliquant, ou en les enrichissant avec des données supplémentaires (telles que les relevés météorologiques), elles deviennent un data asset.

Les actifs data sont donc extrêmement puissants et précieux. Les données sous forme d’actif doivent être gérées aussi efficacement que n’importe quel autre actif de l’entreprise, comme les bâtiments ou les équipements. Pour cela, les organisations doivent mettre en place une stratégie efficace pour collecter les données, les transformer en actifs et les rendre disponibles à l’échelle de l’entreprise et de son écosystème, notamment auprès des partenaires et du grand public. Les actifs de données peuvent inclure tout type de données : des données clients, des données de vente, des données de capteurs, des données d’enquête/recensement, des données financières telles que les budgets et les comptes, et les données issues du web et des réseaux sociaux.

Comment maximiser la valeur de vos actifs data ?

Compte tenu du volume et de la diversité des données créées et collectées par les organisations, elles doivent mettre en place une stratégie efficace pour transformer les informations brutes en actifs data, couvrant quatre domaines de la gestion des actifs data :

Stratégie de données

Étant donnée la quantité d’informations générées, il est impossible de transformer chaque source de données brutes en un data asset. Les équipes doivent établir des priorités, en fonction des données les plus utiles qui apporteront la plus grande valeur et aideront à atteindre les objectifs de l’organisation.

Protection des données

Les entreprises doivent assurer la sécurité et la protection de leurs données conformément aux réglementations telles que le RGPD et la CCPA. Ils doivent veiller à ce que les renseignements personnels et confidentiels soient stockés de façon sûre, accessibles uniquement aux personnes qui en ont besoin, et à ce que des politiques soient en vigueur pour assurer la conformité.

Gouvernance des données

Pour générer de la valeur, les actifs data doivent être fiables. Les données sous-jacentes doivent être correctes, à jour et conformes aux directives de l’organisation. Les programmes de gouvernance des données des organisations sont donc essentiels pour définir et appliquer les normes relatives aux données afin de garantir leur fiabilité.

Data management

Les actifs data doivent être accessibles à toutes les personnes à qui elles seront utiles. Cela signifie que les organisations doivent mettre en place des processus de data management globaux efficaces pour collecter et enrichir les données brutes, les transformer en actifs data, puis les partager en toute sécurité dans toute l’organisation, p. ex. : via une data marketplace ou un portail de données. À ce titre, elles doivent créer un inventaire complet pour obtenir une image complète de tous les actifs data.

Copy to clipboard

Comme son nom l’indique, un data product est un produit construit autour de données. Il contient tout ce qui est nécessaire pour accomplir une tâche ou un objectif spécifique en utilisant ses données sous-jacentes. Ainsi, outre le data asset lui-même, il doit inclure une interface permettant d’accéder aux données, des outils pour manipuler ou visualiser l’information, et des métadonnées descriptives pour expliquer ce qu’elles contiennent. Il doit pouvoir être utilisé sans nécessiter de compétences techniques de la part de l’utilisateur final, et répondre au besoin spécifique et continu de celui-ci.

Les produits de données se répartissent en trois catégories :

  • Des services de données, tels que des tableaux de bord interactifs ou des applications reposant sur des données. Souvent, ces données en tant que services de produit sont monétisées et vendues à des partenaires ou à des clients, générant ainsi des revenus supplémentaires.
  • Des produits existants améliorés grâce aux données, par exemple : une montre intelligente recueille et produit des données issues d’un capteur pour apporter une valeur ajoutée à l’utilisateur en termes de santé et d’activité physique.
  • Des connaissances grâce à une analyse continue des données. Parmi les produits de cette catégorie, on peut citer des moteurs de recommandation sur les réseaux sociaux ou les sites web e-commerce qui utilisent les données pour fournir des informations aux clients.

Comment créer une stratégie de data product ?

La création d’un data product nécessite des ressources pour identifier les actifs data nécessaires, ajouter l’interface et les métadonnées pour les rendre utilisables, et le gérer de façon continue pour s’assurer qu’il reste à jour et accessible. Les produits des données doivent donc être développés pour répondre à un besoin précis et continu de l’organisation, et non pour une exigence ponctuelle, car leur création ne serait pas rentable.

Pour optimiser l’efficacité, les organisations doivent créer une stratégie de gestion continue des produits data qui réutilise les processus et l’infrastructure et uniformise le développement. Tout comme les produits construits dans une usine, les produits de données doivent être créés à l’aide de processus de gestion des données produits établis. Ces processus permettent de réduire le temps et les efforts nécessaires aux responsables de produits de données pour les créer, de garantir le respect des directives de l’organisation en matière de données, et de répondre aux besoins des utilisateurs.

Produits de données et data mesh

Le data mesh est une architecture de données d’entreprise basée sur une approche distribuée et décentralisée de la gestion et du partage des données. L’un de ses principaux objectifs est de transformer les données en valeur en simplifiant autant que possible la création de produits de données, ce qui facilite une utilisation à grande échelle des données au sein et à l’extérieur de l’organisation.

Cependant, bien que les produits de données soient l’un des quatre piliers fondamentaux du data mesh, les produits de données eux-mêmes peuvent être développés indépendamment de l’architecture.

Copy to clipboard

Les deux visent à rendre les données plus accessibles et plus consommables dans toute l’organisation. Bien qu’ils aient les mêmes objectifs, il existe quatre différences principales entre eux :

  • Sophistication. Un data product est un ensemble d’actifs data, d’outils et d’interfaces, qui le rend facilement utilisable. Il fournit une solution complète qui repose sur des actifs data.
  • Visée commerciale. Un data product est conçu pour répondre à un besoin commercial spécifique, tel qu’un tableau de bord de surveillance qui associe plusieurs actifs data ou qui a été créé pour être vendu à des clients.
  • Besoin continu. Les actifs de données peuvent être créés de manière ponctuelle pour répondre à un besoin unique. En revanche, les produits de données sont une solution permanente, conçue pour être utilisée et prise en charge à plus long terme.
  • Processus. Les produits de données sont construits à l’aide de processus uniformisés afin de maximiser l’efficacité. Bien qu’ils respectent les règles de gouvernance des données de l’organisation, les actifs data peuvent être créés pour un projet en particulier, afin de répondre à un besoin précis.

Les produits de données sont donc l’étape suivante par rapport aux actifs de données : ils permettent la création d’applications ou de solutions construites sur une combinaison d’actifs data, de besoins de l’organisation et des outils, de l’interface et des métadonnées nécessaires pour rendre les données accessibles aux non-spécialistes. Pour devenir axées sur les données, les organisations doivent créer à la fois des actifs data et des produits de données, et les partager efficacement et en toute sécurité en interne ainsi qu’avec les partenaires externes et les clients. Une marketplace ou un portail de données offre un moyen centralisé de partager les actifs data et les produits de données dans toute l’organisation, avec tous les types d’utilisateurs, ce qui optimise leur valeur, facilite l’utilisation des données à une plus grande échelle, et accélère leur démocratisation.

Vous souhaitez en savoir plus sur l’accélération de votre stratégie de données par le biais d’une marketplace ? Contactez-nous pour réserver une démo de notre solution.

Articles sur le même thème : Gouvernance Partage de données Service data Portail de données Data product
En savoir plus
Donner accès à vos assets data pour créer de la valeur à grande échelle Transformation numérique
Donner accès à vos assets data pour créer de la valeur à grande échelle

Quelles sont les motivations des organisations pour engager un projet de portail de données ? Comment mettent-elles en œuvre des portails de données ? Quels sont les bénéfices attendus et les fonctionnalités clés d’un portail de données ?

Gouvernance des données vs data management : quelles sont les principales différences ? Accès aux données
Gouvernance des données vs data management : quelles sont les principales différences ?

Pour maximiser la valeur de leurs données, les organisations se concentrent à la fois sur la gouvernance des données et sur le data management. Il n'est pas rare de confondre ces concepts qui sont étroitement liés.

La gouvernance des données dans les solutions Cloud Tendances
La gouvernance des données dans les solutions Cloud

La gouvernance des données est essentielle pour garantir des données fiables, dignes de confiance et accessibles par les bons utilisateurs, et ainsi permettre aux entreprises de devenir véritablement data-centric. S'assurer de la bonne gouvernance des données présentes sur le Cloud pose de nouveaux défis en matière de contrôle, de sécurité et de conformité.