[WEBINAR : 25 JUIN] Augmenter l’expérience de recherche au sein d’une marketplace data grâce à l’IA

Je m'inscris
Data en libre service

Transformer votre catalogue data en un portail de données interne et créer de la valeur

La création d’un portail de données est la clé pour exploiter les données et faciliter leur réutilisation au-delà des cercles d'experts dans les organisations. Découvrez les limites des solutions de “data catalog” et les solutions existantes pour créer de la valeur à partir de vos données.

Brand content manager, Opendatasoft
Voir tous ses articles

Alors que les volumes de données produites par les organisations ne cessent de croître, le catalogue de données apparaît comme une nécessité car il permet de documenter et d’organiser son patrimoine de données. Mais cette solution à elle-seule ne permet pas de démocratiser les usages et créer de la valeur.

La création d’un portail de données est la clé pour exploiter les données et faciliter leur réutilisation au-delà des cercles d’experts dans les organisations. Découvrez les limites des solutions de “data catalog” et les solutions existantes pour créer de la valeur à partir de vos données.

Copy to clipboard

Face à l’augmentation des quantités de datas, les data analysts et data scientists ont recours à des outils pour trier les données et les documenter. C’est le rôle du catalogue de données. Cet inventaire organisé permet de faciliter les processus de collecte, de mise en qualité, d’enrichissement et d’analyse.

Qu’est-ce qu’un catalogue de données ?

Le data catalog se présente comme un inventaire répertoriant toutes les données d’une organisation. Au-delà de regrouper les datas en seul lieu, le catalogue contient des métadonnées qui permettent aux utilisateurs de savoir si les informations disponibles sont pertinentes ou non au regard de leurs problématiques.

Pourquoi utiliser un data catalog ?

La mise en place d’un catalogue de données confère aux organisations une multitude de bénéfices. À savoir :

  • La documentation : toutes les données sont répertoriées à un seul et même endroit, ce qui centralise l’information sur leur existence.
  • La recherche : grâce à des fonctionnalités de filtre, de tri ou de recherche, les utilisateurs peuvent facilement identifier les informations pertinentes.
  • Le gain de temps : comme les données sont plus faciles à trouver, les équipes techniques gagnent un temps précieux pour l’utilisation et l’exploitation des données.
Copy to clipboard

Si l’implémentation des catalogues de données est absolument nécessaire aux organisations, elle présente plusieurs limites.

Une solution complexe réservée aux experts

La majorité des catalogues de données disponibles sur le marché sont des solutions relativement complexes et codifiées. Pour utiliser ces outils, il convient donc de disposer de compétences spécifiques, à la fois lors de l’implémentation, mais aussi pour rechercher des données.

Or, pour apporter de la réelle valeur ajoutée à l’organisation, toutes les parties prenantes doivent pouvoir accéder facilement aux données : les collaborateurs du département RH, marketing, finance,,et pas seulement les experts data qui disposent de connaissances techniques avancées.

Des usages restreints

Au-delà d’un manque de simplicité, ce sont les usages mêmes du catalogue de données qui semblent limités. La plupart du temps, ces outils se présentent comme une sorte de catalogue de métadonnées permettant de faciliter l’identification des données.

Mais là encore, pour créer de nouveaux services et optimiser la prise de décisions, il ne suffit pas d’identifier les données. Il faut pouvoir les rendre facilement accessibles, compréhensibles, réutilisables et les mettre à disposition de tous en self service.

Copy to clipboard

Si le catalogue de données est plus que nécessaire dans le cadre du développement d’une stratégie data, il se révèle insuffisant à lui seul pour développer des usages générateurs de valeur.

Pour démocratiser les données dans vos écosystèmes, les données doivent être :

  • mises en qualité, enrichies et formatées : les données doivent être nettoyées avant d’être rendues accessibles à tous sur une plateforme data afin de créer un climat de confiance vis-à-vis du partage des données dans votre organisation.
  • accessibles par toutes les parties prenantes de votre choix via un point d’accès unique. Grâce à des fonctionnalités de recherche et de filtrage, les utilisateurs n’ayant pas d’expertise technique doivent pouvoir retrouver des données « prêtes à l’emploi » en quelques clics.
  • présentées dans des formats adaptés à votre audience : data visualisations, dashboards, graphiques, format brut, etc. Les données doivent également être interopérables avec les outils métiers des collaborateurs de l’organisation.
  • documentées grâce aux métadonnées (DCAT, DCAT-AP, INSPIRE) pour pouvoir être comprises par tous et réutilisées en toute confiance.
  • disponibles dans des formats encourageant leur réutilisation. Soit via des options d’export (Excel, CSV, APIs et sous forme de données SIG, telles que GPX pour la cartographie des smartphones).

Découvrez dans notre Ebook comment partager vos données à travers un portail de données.

Copy to clipboard

Métropole de Rouen Normandie : du catalogue de données géographiques au portail open data

La métropole de Rouen Normandie a souhaité adopter un catalogue data pour gérer ses données géographiques en 2017. Un répertoire de données existait déjà mais il n’était pas mis à jour, ce qui rendait l’accès aux données relativement complexe.

Pour aller plus loin dans le partage des données, l’implémentation d’une démarche open data s’est très vite imposée. Elle répond à deux objectifs principaux :

  • Décloisonner les directions et automatiser les processus grâce à des connecteurs, des web services, et du moissonnage. L’idée est de rendre la publication la plus fluide possible pour les producteurs de données et de renforcer les processus de gouvernance.
  • Animer la démarche open data sur le territoire grâce à un point d’entrée unique vers les données de la métropole. Cela répond à un objectif de transparence de l’action publique et de renforcement de la participation citoyenne. Cela permet également de favoriser la réutilisation des données et l’innovation : en améliorant la connaissance du patrimoine de données, il est plus facile de réutiliser les informations disponibles. Et donc d’innover.
Flore Bonhomme
Les fonctionnalités d’Opendatasoft permettent de valoriser les données et de les mettre en scène. Notamment grâce aux outils de datavisualisation, qui nous permettent de créer des cartographies ou des observatoires thématiques. Les données peuvent aussi être réutilisées par différentes applications, qu’il s’agisse d’applications tierces, ou développées en interne, comme l’application Rouen Métropole dans Ma Poche qui utilise ces données ouvertes.
Flore Bonhomme
Chargée de projet territoire intelligent et open data

Schneider Electric : créer de nouveaux usages à partir des données de l’entreprise

La stack technologique de Schneider Electric est composée de nombreux outils dédiés à la gestion des données, notamment des catalogues. Mais ces derniers ne permettaient pas à l’organisation de réellement démocratiser la donnée et de les valoriser.

Les équipes de Schneider Electric ont donc eu recours à Opendatasoft pour mettre en place un portail interne accessible par toute l’entreprise : la Data Library. Grâce à cette librairie interne, les data scientists peuvent se concentrer sur l’analyse des données plutôt que sur leur préparation et leur traitement. Les collaborateurs ont désormais accès à une série de dashboards customisables et peuvent partager les datasets en interne.

Mais ce n’est pas le seul bénéfice de l’utilisation d’Opendatasoft. En effet, Schneider Electric a également pu créer une plateforme pour monétiser ses données auprès de partenaires : « Schneider Electric Exchange ». Un usage qu’il aurait été impossible à réaliser avec un simple catalogue.

Ce projet nous a permis de montrer que nous étions capables de capter des données, de les traiter, de les enrichir et de les valoriser, principalement dans les domaines de l’IoT, de l’energy management et de l’industrie. La plateforme m’a donné la chance de comprendre la mécanique qui permet de générer de la valeur à partir de nos données, et c’est très fort.
Herveig Lecuyer
Data Factory Program Lead, Schneider Electric
Lire le cas d’usage

Les catalogues de données sont des outils indispensables pour faire l’inventaire de vos données et soutenir votre politique de gouvernance. Mais ils ne permettent pas de rendre la donnée facilement accessible et consommable en interne par le plus grand nombre pour accélérer les usages et libérer leur valeur potentielle. La création d’un portail de données est la clé pour exploiter toute la valeur des données et contribuer à démocratiser leurs usages au service d’organisations véritablement data-centric.

Articles sur le même thème : Métadonnées Self-service data Catalogue data

En savoir plus
Qu’est-ce que le Data hub d’Opendatasoft ? Accès aux données
Qu’est-ce que le Data hub d’Opendatasoft ?

Le Data hub d’Opendatasoft est une plateforme regroupant plus de 28 000 jeux de données publiés en open data par toutes les organisations et gouvernements engagés dans une démarche d'ouverture de leurs données. Le Data hub héberge également plus de 600 datasets de référence, entretenus et mis à jour par nos équipes.

Comment accélérer la réutilisation des données grâce aux fonctions de recherche approfondie Produit
Comment accélérer la réutilisation des données grâce aux fonctions de recherche approfondie

Sans moteurs de recherche efficaces, le web ne serait qu'une énorme masse d'informations désorganisées. Dans ce blog, nous vous expliquons comment les fonctions de recherche approfondies permettent d'augmenter le nombre d'utilisateurs de votre plateforme data et de démocratiser les données.

Comment rendre les données accessibles en self-service dans son organisation — l’exemple d’Opendatasoft Produit
Comment rendre les données accessibles en self-service dans son organisation — l’exemple d’Opendatasoft

La mise à disposition de vos données en self-service pour tous les collaborateurs est un levier puissant pour améliorer l’efficacité et la transparence en interne. Découvrez comment nous avons mis en place notre portail interne de données chez Opendatasoft.

Qu’est-ce que le Data hub d’Opendatasoft ? Accès aux données
Qu’est-ce que le Data hub d’Opendatasoft ?

Le Data hub d’Opendatasoft est une plateforme regroupant plus de 28 000 jeux de données publiés en open data par toutes les organisations et gouvernements engagés dans une démarche d'ouverture de leurs données. Le Data hub héberge également plus de 600 datasets de référence, entretenus et mis à jour par nos équipes.

Comment accélérer la réutilisation des données grâce aux fonctions de recherche approfondie Produit
Comment accélérer la réutilisation des données grâce aux fonctions de recherche approfondie

Sans moteurs de recherche efficaces, le web ne serait qu'une énorme masse d'informations désorganisées. Dans ce blog, nous vous expliquons comment les fonctions de recherche approfondies permettent d'augmenter le nombre d'utilisateurs de votre plateforme data et de démocratiser les données.

Comment rendre les données accessibles en self-service dans son organisation — l’exemple d’Opendatasoft Produit
Comment rendre les données accessibles en self-service dans son organisation — l’exemple d’Opendatasoft

La mise à disposition de vos données en self-service pour tous les collaborateurs est un levier puissant pour améliorer l’efficacité et la transparence en interne. Découvrez comment nous avons mis en place notre portail interne de données chez Opendatasoft.