Language

[Product Talk] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Je m'inscris
Glossaire

Collecte de données

La collecte de données est le processus systématique et méthodologique de collecte de données brutes provenant de l'intérieur et de l'extérieur d'une organisation.

Qu’est-ce que la collecte de données ?

La collecte de données est le processus systématique et méthodologique de collecte de données brutes, provenant de multiples sources au sein d’une organisation et au-delà. C’est la première étape de tout processus de gestion des données, et l’utilisation de ces données permet aux organisations de comprendre leurs performances, de prendre des décisions mieux informées, de tester des hypothèses et de partager des données en interne et en externe.

La collecte de données couvre plusieurs types d’informations, tant quantitatives que qualitatives, y compris :

  • Données créées par des systèmes au cours de leurs opérations (telles que des capteurs IoT, des machines, des voitures connectées)
  • Données capturées par le comportement humain, comme lorsqu’un client navigue sur un site web
  • Données saisies dans les systèmes par les clients/consommateurs, comme le remplissage de formulaires en ligne
  • Données saisies dans les systèmes par le personnel, comme lors d’un appel avec des clients dans un centre de contact
  • Données générées par des systèmes commerciaux, tels que les solutions de vente, de CRM ou de comptabilité
  • Données capturées directement par des chercheurs lors d’entretiens ou de groupes de discussion
  • Données collectées auprès de tiers, tels que des partenaires ou des courtiers en données

Quel est le processus de collecte de données ?

Nous vivons dans un monde où les données sont créées à un rythme exponentiellement croissant. Il est donc important d’adopter une approche systématique de la collecte de données, plutôt que de simplement collecter des données sans plan ni méthodologie. Il est recommandé de suivre ce processus :

  1. Identifier ce que vous souhaitez accomplir. Cela affectera les données que vous collectez et leur source.
  2. Sélectionner les ensembles de données appropriés à collecter. Comprenez quelles sources de données vous allez rassembler pour atteindre vos objectifs et découvrez qui possède les données.
  3. Vérifier la qualité des données avant de commencer la collecte. Travaillez avec le propriétaire des données pour vous assurer qu’elles répondent à vos besoins et qu’elles ont le niveau de granularité requis.
  4. Créer un processus documenté pour la collecte de données. Cela devrait inclure la fréquence de collecte des données, où elles seront acheminées, comment elles seront utilisées et les mesures de sécurité en place pour les protéger.
  5. Collecter les données. Automatisez le processus de collecte de données, mais assurez-vous qu’il y a une vérification rigoureuse des erreurs pour garantir qu’elles sont au bon format et de haute qualité.
  6. Revoir régulièrement l’ensemble du processus, en particulier s’il y a des changements dans la source des données elle-même.

Quels sont les défis d’une collecte de données efficace ?

Étant la première étape du processus de gestion des données, il est essentiel que la collecte de données soit effectuée correctement et systématiquement.

Les organisations doivent donc surmonter ces principaux défis pour s’assurer que leur collecte de données apporte de la valeur :

  • Assurer la qualité des données. Les données doivent être précises et fiables, sinon les résultats et les décisions prises ultérieurement seront peu fiables. Lors de la collecte des données, assurez-vous que :
    • Elles sont standardisées et dans le bon format, avec des descriptions de chaque champ afin qu’elles puissent être partagées et combinées ultérieurement.
    • Toutes les données pertinentes sont capturées, sans lacunes ni erreurs.
    • Vous comprenez les paramètres clés autour des données, tels que la fréquence de leur création et leur granularité.
    • Elles sont cohérentes, en utilisant les mêmes unités (comme pour le temps, la vitesse ou le poids).
  • Assurer que les données sont adaptées à l’usage prévu. Les données peuvent être générées pour une raison (comme faire fonctionner une machine industrielle), mais ensuite utilisées pour d’autres raisons (comme calculer l’efficacité globale d’une usine). Assurez-vous que les données que vous recueillez sont adaptées à vos besoins.
  • Assurer la sécurité des données. Réduisez le risque de non-conformité en vous assurant que la collecte des données est sécurisée, qu’elle respecte les réglementations telles que le RGPD/CCPA et qu’elle protège les informations personnellement identifiables (PII).
En savoir plus
Data products : les conseils de McKinsey pour diversifier vos revenus Tendances
Data products : les conseils de McKinsey pour diversifier vos revenus

Comment les organisations peuvent-elles trouver de nouvelles sources de revenus en industrialisant la création de produits et services de données externes ? Découvrez les conclusions du dernier rapport de McKinsey et posez les bases d’une stratégie performante.

Quelle est la différence entre un data product et un data asset ? Services data
Quelle est la différence entre un data product et un data asset ?

Les organisations génèrent des volumes croissants de données, mais à elles seules, ces données brutes ne peuvent pas générer de valeur. Elles peuvent être difficiles à interpréter, au mauvais format ou simplement être trop basiques pour être utiles, c’est pourquoi il est plus que nécessaire aujourd’hui de transformer les données brutes en data assets (actifs de données) et en data products (produits de données) à valeur ajoutée et plus accessibles.

Comment transformer le système de santé des Français grâce aux données ? Open data & transparence
Comment transformer le système de santé des Français grâce aux données ?

Comme pour de nombreux secteurs d’activité, nous assistons ces dernières années au besoin d’accélérer les usages de la donnée dans le domaine de la santé. Ces données sont toutefois difficilement accessibles et exploitables. Ouvrir l’accès aux données de santé et les transformer en connaissance actionnable est un enjeu majeur pour permettre aux acteurs et professionnels de la santé de créer de nouveaux usages innovants au service de tous.

Commencez à créer vos expériences data