Language

Etes-vous data-centric ? Découvrez votre niveau de maturité data et profitez de recommandations d'experts

Faites le test
Produit

Comment l’IA transforme notre solution de portail de données et les projets data de nos clients

Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !

Brand content manager, Opendatasoft
Voir tous ses articles

L’Intelligence artificielle (IA) s’impose déjà depuis plusieurs années et les usages se sont fortement accélérés en 2024 avec l’apparition de nouvelles applications et technologies fondées sur des modèles d’IA. 

Dans le domaine du data management, qui comprend de nombreuses tâches fastidieuses et chronophage, l’IA vient également révolutionner les technologies.  

Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment ! 

Copy to clipboard

Nos équipes s’engagent à accélérer les démarches de valorisation et de démocratisation des données de nos clients grâce aux nouvelles opportunités offertes par l’IA.

Un moteur de recherche intelligent fondé sur l’IA

Depuis décembre 2023, les portails Opendatasoft sont équipés d’une recherche sémantique qui va au-delà des correspondances littérales pour comprendre le sens des termes et leur contexte. 

Le nouveau moteur de recherche présent sur les portails de nos clients permet de proposer des suggestions de résultats en temps réel et d’accéder à : 

  • des datasets correspondant au thème recherché, 
  • des actifs data correspondant au thème recherché,  
  • des actifs data qui comprennent le mot clé recherché ou un mot clé similaire.

Cette nouvelle méthode de recherche propose  des résultats plus pertinents et s’exécute très rapidement. La découverte des données est ainsi fortement améliorée et l’expérience utilisateur plus fluide et plus performante. Pour les administrateurs de portail, cela signifie également une maintenance facilitée car il n’est plus nécessaire d’ajouter une liste exhaustive de mots clés dans les métadonnées : l’IA se charge de tout.

Des recommandations de jeux de données similaires

Afin d’améliorer la découvrabilité des données et de fluidifier l’expérience sur les portails data de nos clients, nous proposons également une fonctionnalité de recommandation automatique de données similaires fondée sur l’IA. 

L’ensemble des jeux de données les plus pertinents sont ainsi affichés sur les fiches des actifs data consultés par les utilisateurs. 

Cette approche vise à simplifier l’expérience de découverte des données pour tous les utilisateur·ices, en s’inspirant des meilleures pratiques des marketplaces e-commerce. Elle s’inscrit parfaitement dans la vision d’Opendatasoft de rendre l’accès et l’utilisation des données aussi simples et intuitifs que possible pour un large public de l’expert data au novice. Chaque utilisateur peut ainsi naviguer facilement à travers les quantités et la variété des actifs de données disponibles sur les portails.

Copy to clipboard

Notre choix de migrer vers la recherche sémantique découle d’une volonté d’améliorer l’expérience utilisateur au sein de nos portails de données. La recherche constitue un pilier essentiel de cette expérience, permettant aux utilisateurs de découvrir les données qui les intéressent. Avec la recherche lexicale, les utilisateurs sont souvent bloqués s’ils ne saisissent pas exactement ce qu’ils recherchent. En revanche, la recherche sémantique offre une flexibilité plus grande, en générant des résultats pertinents même pour des requêtes approximatives ou dans une langue étrangère au portail.

L'approche vectorielle (ou sémantique) élimine la frustration potentielle des utilisateurs et améliore significativement leur expérience de recherche. La question ne s'est plus vraiment posée lorsque nous avons évalué et comparé plusieurs modèles d'IA, parmi lesquels le meilleur offrait un gain de pertinence de 64 % par rapport à un moteur de recherche lexical.
Damien Garaud
Backend Software Engineer - Opendatasoft

Les différentes étapes franchies pour améliorer la pertinence du moteur de recherche fondé sur l’IA

Notre parcours d’intégration de l’IA dans le moteur de recherche de notre solution a été itératif. Il a débuté avec une approche vectorielle, qui permettait de gérer des requêtes approximatives comportant des fautes d’orthographe ou des synonymes, avec une pertinence des résultats pouvant être variable. Nous avons ensuite adopté une approche hybride, combinant les méthodes lexicale et vectorielle, et classant les résultats par similarité sémantique et popularité, améliorant ainsi leur pertinence. Enfin, nous sommes revenus à une approche uniquement vectorielle, que nous avons enrichie d’un algorithme de pertinence afin de ne présenter que les résultats les plus pertinents et de ne rien afficher en cas de résultats insuffisants. Cette dernière amélioration permet de garantir une qualité optimale de résultats fournis, tout en tenant compte de l’approximation ou de l’imprécision des requêtes utilisateurs.

Fruit de nos recherches, cet algorithme unique et innovant représente une méthode efficace pour identifier le meilleur ratio entre le nombre de résultats à suggérer et la pertinence des résultats suggérés. Notre cheminement de l’approche vectorielle vers une approche hybride, puis finalement un retour à une recherche sémantique, désormais soutenue par ce nouvel algorithme reflète une évolution continue, où nous ré-évaluons nos choix précédents tout en les enrichissant de nouvelles connaissances. À la manière d’une démarche scientifique, où l'exploration continue et l'intégration de nouvelles données sont essentielles pour parvenir à des solutions toujours plus efficaces.
Damien Garaud
Backend Software Engineer - Opendatasoft

Des résultats prometteurs

Pour mesurer la réussite de ce modèle, nous nous basons toujours sur un indice de pertinence compris entre 0 et 1. Les résultats sont très prometteurs, puisque cet indice est passé de 0,52 à 0,87 en seulement quelques mois en testant ces différentes approches ! 

L’indice de pertinence, bien que crucial, n’est pas le seul facteur que nous devons prendre en compte pour assurer la qualité du moteur de recherche. En tant qu’éditeur de solution, nous sommes confrontés à la nécessité de concilier les divers besoins de nos clients, propres à chaque portail. 

Nous sommes constamment en quête d'un équilibre délicat entre la maximisation du nombre de résultats pertinents et la minimisation des résultats moins adaptés. Certains clients privilégient la quantité de résultats pertinents, tandis que d'autres accordent plus d'importance à la réduction des résultats peu satisfaisants. Notre défi est de trouver le juste milieu pour offrir une expérience satisfaisante à l'ensemble de nos utilisateurs, en tirant parti du meilleur des deux mondes.
Damien Garaud
Backend Software Engineer - Opendatasoft
Copy to clipboard

Nos clients bêta-testeurs ont joué un rôle central dans l’amélioration continue de notre moteur de recherche. Leurs retours tout au long du processus de développement ainsi que notre apprentissage continu des mécanismes d’IA ont permis de façonner un outil de recherche plus centré sur leurs besoins et ceux de leurs utilisateurs :

Le nouveau moteur de recherche fondé sur l’IA facilite grandement l'accès et la découverte des données. Il suggère des données pertinentes même avec des mots-clés approximatifs, réduisant ainsi le risque de passer à côté des données recherchées. Il enrichit également l'expérience utilisateur en mettant en avant des données dignes d’intérêt mais non directement recherchées, créant ainsi un effet de sérendipité. Cette innovation a un impact sur la qualité de nos métadonnées : essentielles à son bon fonctionnement, cela nous encourage à redoubler de vigilance dans leur bonne complétion. En tant que bêta-testeurs, nous avons trouvé cette expérience enrichissante grâce à l'ouverture et à l'écoute attentive des équipes d'Opendatasoft à nos suggestions. Nous restons très intéressés pour suivre son évolution, explorer les prochaines fonctionnalités d'IA de la solution, et recueillir les avis de nos utilisateurs pour mieux comprendre comment ces innovations les aident à trouver des données sur le portail.
Camille Liégeois
Responsable des projets Open data & Ville Numérique, Issy les Moulineaux

Copy to clipboard

Les équipes produit d’Opendatasoft ne s’arrêtent pas là ! De nouvelles fonctionnalités fondées sur l’IA sont en cours de développement ou de test chez nos clients et verront bientôt le jour ! 

Explorer les données avec l’IA

Prochainement, les utilisateurs de portails de données pourront s’appuyer sur l’Intelligence artificielle pour explorer les données. En questionnant un assistant virtuel en langage naturel, ils pourront recevoir des réponses instantanées sous divers formats de visualisation, tels que des cartes, des chiffres ou des graphiques.

 

Construire des pages avec l’IA

Les administrateurs de portail pourront également bientôt utiliser l’IA pour créer et intégrer des pages complètes sur leur portail. Que ce soit pour générer des visualisations dynamiques, construire des pages et agencer les éléments, un assistant virtuel répondra à toutes leurs demandes ! 

Si vous voulez en savoir plus sur les innovations IA qui viendront prochainement enrichir la solution Opendatasoft, contactez l’un de nos experts !

Articles sur le même thème : Fonctionnalités Portail de données Intelligence artificielle
Contenus associés
3 fonctionnalités collaboratives clés pour engager ses consommateurs de données sur son portail data Produit
3 fonctionnalités collaboratives clés pour engager ses consommateurs de données sur son portail data

Comment sortir du cercle vicieux dans lequel les données restent entre les mains des équipes data alors qu'elles devraient être l’affaire de tous les métiers ? Comment inciter vos consommateurs à les utiliser efficacement ? Cet article explique quelles fonctionnalités clés doivent impérativement être activées sur son portail data pour engager les consommateurs de données et maximiser l’utilisation des données au quotidien.

Qu’est-ce qu’un catalogue de données ? Accès aux données
Qu’est-ce qu’un catalogue de données ?

Les organisations produisent aujourd'hui une grande quantité d'actifs de données à travers leurs opérations et services. Exploiter ces données de manière efficace implique de savoir quelles sont les données disponibles et où elles se situent. Pour cela, les entreprises utilisent des catalogues de données centralisés. Cet article explique en quoi consistent ces catalogues et quels sont leurs bénéfices pour les entreprises.

Pourquoi votre portail de données est une véritable de source de ROI ? Tendances
Pourquoi votre portail de données est une véritable de source de ROI ?

Pour bien valoriser vos données, vous devez les rendre accessibles. Découvrez dans cet article comment maximiser votre ROI et choisir le meilleur fournisseur de solution technologique. Les organisations des secteurs public et privé adoptent de plus en plus les portails de données pour centraliser et faciliter l’accès à ces informations pour l’ensemble de leurs utilisateurs, qu’il s’agisse d’employés, de citoyens, de partenaires ou d’autres parties prenantes.