25 avril 2024 - Rencontre administration centrale et services déconcentrés : comment mieux intégrer les données au service des politiques publiques ?

S'inscrire
Produit

Explorer des jeux de données volumineux : l’exemple des incidents à Chicago

Il y a quelques semaines, nous avons assisté à l'ODI Summit et lors d'une session de formation nous a été présenté un jeu de données très intéressant: crime reports in the city of Chicago from 2001 to present.

Sales Director - North America, Opendatasoft
Voir tous ses articles

Dans nos précédents articles, nous avons présenté plusieurs fonctionnalités majeures de la plateforme Opendatasoft : APIs, cartographie avancée, jeux de données temps-réel, fonctionnalités sociales…

Aujourd’hui, nous souhaitons revenir sur une des fonctionnalités de base de la plateforme : la possibilité d’explorer des jeux de données volumineux grâce à la navigation par filtres, la recherche plein texte et les différentes possibilités de visualisation des données.

Il y a quelques semaines, nous avons assisté à l’ODI Summit et lors d’une session de formation nous a été présenté un jeu de données très intéressant: crime reports in the city of Chicago from 2001 to present.

Ce jeu de données contient près de 5 millions d’enregistrements et sa taille est de plus de 1G. N’essayez bien sûr pas de l’ouvrir avec Excel…

Nous avons donc exporté ce jeu de données en CSV et l’avons importé sur public.Opendatasoft.com: http://public.Opendatasoft.com/explore/dataset/chicago_incidents_2001_present/.

Copy to clipboard

Comme vous pouvez le voir ci-dessous, la colonne de gauche contient un ensemble de filtres qui peuvent être utilisés pour affiner l’affichage. L’ensemble des filtres donne un résumé intéressant du contenu du jeu de données. Par exemple, nous apprenons que 20% des incidents reportés sont des vols. Les filtres peuvent aussi être utilisés pour affiner l’affichage et n’afficher les enregistrements que d’un filtre ou d’un ensemble de filtres.

Copy to clipboard

Une fonctionnalité intéressante est également la possibilité de filtrer les résultats à partir d’une recherche textuelle. Par exemple, nous voyons ci-dessous que 87 000 incidents mentionnent le terme “héroïne”. Bien sûr, les termes de la requête peuvent être combinés pour produire des expressions complexes, mélangeant des critères de recherche textuelle et numérique.

 

Copy to clipboard

Passons maintenant à la vue carte. La première vue affiche un clustering géographique des données. Au fur et à mesure des zooms et des déplacements de la carte, les clusters s’adaptent automatiquement au niveau de zoom et à la position de la carte. Au niveau de zoom maximal vous pouvez afficher les détails d’un incident particulier. Cette fonctionnalité permet d’afficher sur une simple carte et de manière très performante des centaines de milliers voire des millions d’enregistrements.

Copy to clipboard

La vue “analyse” permet de construire rapidement et simplement des graphiques. Ces graphiques sont basés sur des agrégations selon les filtres qui ont été choisis. Un grand nombre de représentations sont disponibles : graphiques en colonnes et en barres, camemberts, graphiques temporels, etc.

Copy to clipboard

Et bien sûr, avec nos fonctionnalités Cartographe et Chart Builder, vous pouvez construire de manière très simple des visualisations avancées combinant sur une même représentation plusieurs jeux de données.

Comme vous pouvez le voir, toutes ces représentations sont construites à partir de fonctionnalités standard de la plateforme Opendatasoft.

Que ce soit pour de petits jeux de données ou pour de gros jeux de données, il est de plus en plus important pour une plateforme open data de fournir à ses utilisateurs des outils permettant de les visualiser simplement et de manière performante.


Plus d'articles
Portail de données : La solution des leaders data pour maximiser leur impact Ebook
Portail de données : La solution des leaders data pour maximiser leur impact

Les organisations ont compris l’importance des données pour la réussite de leurs stratégies et pour leur développement. Un accès simplifié et rapide aux données, dans le bon format et au bon moment, est crucial pour améliorer la prise de décision, l’efficacité et la collaboration, mais aussi pour réduire les coûts, créer de nouvelles sources de revenus et atténuer les risques. Cet ebook fournit une introduction aux portails de données, tant au niveau stratégique que tactique. Il réunit les meilleures pratiques pour démocratiser vos données et en libérer la valeur.

Portails data internes ou espaces de données : les bénéfices pour les collectivités territoriales Accès aux données
Portails data internes ou espaces de données : les bénéfices pour les collectivités territoriales

Les agents opérant au service des villes et des municipalités doivent bénéficier d’un accès facilité et sécurisé à des données fiables afin d’être plus efficaces dans leurs missions quotidiennes et de prendre de meilleures décisions pour améliorer la vie des résidents et créer de nouveaux services innovants. Découvrez comment les portails internes ou espaces de données répondent à ces objectifs.

Étude : Quelle est la maturité data des acteurs de l’énergie en Europe ? Tendances
Étude : Quelle est la maturité data des acteurs de l’énergie en Europe ?

Comment le secteur de l'énergie en Europe exploite-t-il les données pour répondre aux challenges actuels ? Nous avons interrogé plus de 50 acteurs pour établir un état des lieux des pratiques en matière d'utilisation et de partage des données et comprendre la place des données dans leur stratégie de transformation.

Portail de données : La solution des leaders data pour maximiser leur impact Ebook
Portail de données : La solution des leaders data pour maximiser leur impact

Les organisations ont compris l’importance des données pour la réussite de leurs stratégies et pour leur développement. Un accès simplifié et rapide aux données, dans le bon format et au bon moment, est crucial pour améliorer la prise de décision, l’efficacité et la collaboration, mais aussi pour réduire les coûts, créer de nouvelles sources de revenus et atténuer les risques. Cet ebook fournit une introduction aux portails de données, tant au niveau stratégique que tactique. Il réunit les meilleures pratiques pour démocratiser vos données et en libérer la valeur.

Portails data internes ou espaces de données : les bénéfices pour les collectivités territoriales Accès aux données
Portails data internes ou espaces de données : les bénéfices pour les collectivités territoriales

Les agents opérant au service des villes et des municipalités doivent bénéficier d’un accès facilité et sécurisé à des données fiables afin d’être plus efficaces dans leurs missions quotidiennes et de prendre de meilleures décisions pour améliorer la vie des résidents et créer de nouveaux services innovants. Découvrez comment les portails internes ou espaces de données répondent à ces objectifs.

Étude : Quelle est la maturité data des acteurs de l’énergie en Europe ? Tendances
Étude : Quelle est la maturité data des acteurs de l’énergie en Europe ?

Comment le secteur de l'énergie en Europe exploite-t-il les données pour répondre aux challenges actuels ? Nous avons interrogé plus de 50 acteurs pour établir un état des lieux des pratiques en matière d'utilisation et de partage des données et comprendre la place des données dans leur stratégie de transformation.