Intégration des modèles LLM de Mistral AI pour une IA souveraine et une approche multi-modèles adaptée aux besoins de nos clients
Pour répondre aux enjeux de souveraineté de nos clients et leur permettre de tirer parti des fonctionnalités optimisées par l'IA, notre solution de portail de données Opendatasoft s’appuie désormais sur l'IA générative de MistralAI, en complément de celle d'OpenAI déjà déployée en 2023. Notre approche “multi-modèles” présente de nombreuses vertus pour nos clients et leurs consommateurs data comme pour nos équipes R&D et notre innovation future.
L’intelligence artificielle répond à de nombreux besoins, et depuis l’enthousiasme suscité par ChatGPT en 2023, la plupart des organisations ont saisi l’opportunité de l’intégrer à leurs produits et services, si bien qu’il devient de plus en plus difficile de faire la distinction entre les véritables cas d’usage et les simples tendances passagères. Chez Opendatasoft, les équipes ont depuis longtemps exploré des applications concrètes de l’IA, traduites par des fonctionnalités rapidement adoptées par nos clients. Pour aller plus loin, Opendatasoft intègre aujourd’hui le modèle de LLM de MistralAI, un acteur européen de l’IA générative, permettant à une partie de nos clients, sensibles aux enjeux de souveraineté, d’en bénéficier également.
L’intégration de l'IA dans notre solution de portail de données : une approche multi-modèles en 3 étapes
L’intégration de l’IA ne se fait pas en un clin d’œil ; une stratégie efficace exige des choix réfléchis à chaque étape pour proposer des fonctionnalités pertinentes qui répondent aux enjeux de nos clients et apportent une réelle valeur ajoutée. Dans le cadre de sa stratégie d’IA, Opendatasoft a suivi trois étapes clés avant de déployer ses fonctionnalités :
- Le choix des modèles : Opendatasoft a, dès le début de ses explorations dans le domaine de l’IA, décidé d’exploiter les modèles et les services proposés par des acteurs établis, en commençant avec les modèles disponibles et proposés par OpenAI. Cette stratégie lui a permis de concentrer ses efforts sur le développement de fonctionnalités, chacune reposant sur un modèle parfaitement adapté à son cas d’usage. Aujourd’hui, ces mêmes modèles proposés par MistralAI ont été intégrés dans la solution.
- Le choix de l’hébergement et notamment pour répondre aux enjeux de souveraineté : une fois les modèles sélectionnés, se pose la question de leur hébergement. À nouveau, Opendatasoft a choisi de s’appuyer sur des infrastructures existantes, fournies par des partenaires tels qu’OpenAI et MistralAI, ce dernier offrant l’avantage d’héberger ses modèles en Europe. Ce choix repose sur une demande croissante de ses clients en matière de localisation et d’hébergement des modèles. Une problématique de taille, notamment pour les organisations de l’Union européenne, qui doivent répondre à des exigences de souveraineté, de compatibilité et de conformité RGPD.
- Les méthodes d’interrogation des modèles pour optimiser la valeur de l’IA : en s’appuyant sur des modèles d’IA et des infrastructures d’hébergement existants, Opendatasoft a pu concentrer ses ressources et son expertise sur l’un des aspects clés de sa stratégie IA : l’optimisation des méthodes d’interrogation des modèles. Les équipes R&D d’Opendatasoft s’attachent à optimiser la façon d’interroger les modèles d’IA pour fournir le bon contexte et trouver un juste équilibre entre la quantité minimale d’informations transmises et la pertinence des résultats produits par l’IA. Ce processus d’optimisation transforme cette technologie en un puissant moteur d’innovation et de performance pour l’exploitation des données.
L’intégration de l'IA dans notre solution de portail de données : une approche méthodique et centrée sur la démocratisation des données
Comprendre l'IA pour mieux l'exploiter et en tirer de la valeur ajoutée
Développer des outils intelligents basés sur l’IA nécessite une compréhension approfondie de leurs mécanismes. Conscientes de ces enjeux, les équipes d’Opendatasoft s’appuient sur des cas d’usage concrets pour offrir des solutions pertinentes qui soutiennent leur mission de démocratisation de l’accès aux données. Pour atteindre cet objectif, il est crucial que les modèles d’IA s’adaptent au contexte dans lequel ils sont utilisés. Dans le cas d’Opendatasoft, cela signifie que les requêtes formulées par les utilisateurs peuvent être enrichies d’éléments contextuels tels que des métadonnées ou des extraits de données. Ces éléments permettent d’exploiter l’IA de manière efficace et de révéler des insights précieux, transformant ainsi les données en atouts stratégiques pour les utilisateurs.
Identifier les différences entre les modèles d’IA pour mieux les adapter
L’intégration des modèles de Mistral AI a conduit les équipes R&D d’Opendatasoft à travailler sur une approche multi-modèles. Bien que les performances de ces modèles soient quasiment équivalentes, une différence majeure demeure : la manière dont un modèle répond, qui varie selon la formulation des questions. C’est ici que les équipes d’Opendatasoft jouent un rôle essentiel en interrogeant de manière pertinente les modèles, en tenant compte de leurs spécificités et du contexte d’utilisation. L’objectif ? Assurer que les utilisateurs obtiennent des résultats cohérents d’un modèle à l’autre lorsqu’ils interagissent avec l’IA.
Tester, itérer et diffuser la connaissance pour des modèles toujours plus performants
Pour garantir des fonctionnalités fiables, les équipes R&D d’Opendatasoft appliquent un principe fondamental : ne pas faire confiance aveuglément à l’IA. Elles interrogent les modèles en leur fournissant un maximum de contexte pour produire des résultats basés sur des informations réelles. Par exemple, pour réduire le risque d’hallucination (lorsqu’un modèle fournit une réponse incorrecte parce qu’il a reçu une question incohérente), nos équipes interrogent les modèles et leur apprennent à répondre par « non » lorsque la réponse n’est pas cohérente, plutôt que de donner une information erronée. Pour faciliter la diffusion de la connaissance en interne et permettre un suivi précis des apprentissages de l’IA, les résultats de centaines de tests sont centralisés et présentés dans des tableaux de bord internes, qui mettent en évidence des indicateurs clés tels que l’évolution des performances des requêtes, le temps de réponse et l’estimation des coûts.
Les fonctionnalités d’IA déjà disponibles sur les portails de données Opendatasoft
Depuis près d’un an, Opendatasoft offre à ses utilisateurs plusieurs fonctionnalités basées sur l’IA, intégrées à leurs portails de données, afin d’améliorer les performances et optimiser la consommation de leurs données :
- Une recherche intelligente pour identifier toutes les données pertinentes : les portails d’Opendatasoft ont intégré une recherche sémantique basée sur un modèle vectoriel pour permettre d’améliorer la pertinence des résultats. Concrètement, ce moteur de recherche multilingue permet d’aller au-delà des recherches par mots-clés et des correspondances littérales, en prenant en compte le contexte ainsi que l’intention des utilisateurs, offrant ainsi des résultats rapides et pertinents. Une recherche qui ne laissera plus les utilisateurs passer à côté de données utiles pour leurs besoins.
- Des recommandations de données similaires : inspirée de l’expérience e-commerce, Opendatasoft intègre une fonctionnalité qui aide les utilisateurs à découvrir des données pertinentes grâce à des recommandations de jeux de données similaires. Cette approche prolonge l’engagement des utilisateurs et enrichit leur expérience en augmentant le volume de données consultées sur le portail. En mettant en avant les actifs de données les plus pertinents, elle simplifie la navigation et permet un accès facile à une multitude d’informations complémentaires.
- La création de visualisations de données pour donner vie aux données brutes : en intégrant cette fonctionnalité de génération de dataviz, Opendatasoft offre à ses utilisateurs la possibilité de créer et de réutiliser des cartes, tableaux ou encore graphiques en quelques clics seulement grâce à l’IA. Un outil innovant, interactif et pédagogique, qui permet aux utilisateurs de se familiariser avec l’IA tout en exploitant des données brutes de façon autonome !
Nos prochaines étapes avec l'IA pour stimuler l’innovation et accélérer la démocratisation des données
L’IA est une technologie puissante et en constante évolution au sein de notre écosystème numérique, que nous mettons à profit pour aider nos clients à relever efficacement leurs défis liés aux données. Voici un aperçu de nos ambitions avec l’IA pour enrichir notre solution :
- Intégrer les modèles de nos clients : dans notre approche multi-modèles, nous souhaitons à terme permettre à nos clients de choisir parmi différents modèles d’IA et de faciliter l’intégration prochaine de leurs propres modèles, et envisageons même de leur proposer des outils que nos équipes utilisent en interne pour évaluer la qualité du contenu généré et identifier le modèle le plus pertinent.
- Aider les utilisateurs à se servir de l’IA : nous travaillons également à fournir toutes les ressources nécessaires pour les aider à tirer pleinement parti des fonctionnalités existantes, car l’IA est comparable à un vélo électrique : elle offre une assistance précieuse, mais nécessite de savoir pédaler pour en tirer le plein potentiel.
- Proposer un chatbot : nous envisageons l’intégration d’un chatbot permettant à l’utilisateur final d’interagir avec l’ensemble des actifs de données du portail.
La liste des fonctionnalités applicables aux enjeux data est vaste, et les idées ne manquent pas : automatisation de tâches, préparation et mise en qualité de données, définition de chaînes de traitement, extraction de métadonnées, synthèse de documents… Une chose est certaine : pour Opendatasoft, l’utilisation de l’IA ne risque pas de s’arrêter là.
Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !
L'enrichissement des données (ou data enrichment) est essentiel pour transformer vos données brutes en informations précieuses qui peuvent être facilement comprises et utilisées en interne et en externe. Notre blog explique comment mettre en œuvre avec succès l'enrichissement des données dans votre entreprise afin d'améliorer la qualité, la cohérence et la standardisation pour maximiser la valeur.
Déployer un portail de données centralisé vous semble à la portée de vos équipes ? Vous risquez de créer une solution inadaptée qui ne répond ni aux besoins des utilisateurs, ni à ceux de votre entreprise. Découvrez dans cet article de blog pourquoi le choix d’un fournisseur SaaS indépendant est la meilleure option, et les critères à rechercher chez un partenaire.