Blog

L’Open Data ou comment contextualiser nos « insights »

Les entreprises et organismes publics  partagent leurs données, c’est un fait. Les initiatives fleurissent et il est important d’en être informé pour pouvoir emboîter le pas au bon moment et ainsi développer votre avantage concurrentiel. 

Qu'est-ce que l'Open Data ? 

C’est assez simple ! L’open data est comme son nom l’indique une donnée ouverte. Cela signifie que chacun peut accéder à l’information et l’utiliser sans coût. Les principes définis par la Sunlight Foundation (organisation à but non lucratif regroupant les partisans de la donnée ouverte) sont les suivants. La donnée doit être :

  • Complète
  • Primaire
  • Opportune
  • Accessible
  • Exploitable
  • Non-Discriminatoire
  • Non-Propriétaire
  • Libre de droits
  • Permanente
  • Gratuite

Qui partage des données et quel est leur intérêt ?

Le plus gros partage d’informations est effectué en France par le gouvernement au travers de son portail data.gouv.fr. On retrouve des contributions de l’Etat (administrations centrales, autorités administratives...), les collectivités territoriales (villes, conseils généraux…) ou les entités  poursuivant une mission de service public (SNCF, RATP, Pôle Emploi...).

On trouve également de gros contributeurs dans le domaine du privé qui utilisent des API pour partager leurs données. Leur intérêt répond à un devoir de transparence et de mise à disposition des données publiques pour le gouvernement. Pour les organismes privés, l’objectif est la satisfaction client grâce à de nouveaux services gratuits comme le suivi de la consommation  grâce au compteur Linky chez Edf par exemple.

Quelques exemples simples de réutilisations

Les réutilisations les plus courantes répondent à des besoins de Data Visualisation. Elles concernent par exemple les transports ou les fréquentations de lieux touristiques en affichage cartographique mais ne sont pas « industrialisables ».

Une autre manière d’exploiter ces informations est la contextualisation des insights. Par exemple, quoi de plus contextuel que la météo ? En effet, celle-ci est au cœur des problématiques de beaucoup d’entreprises, citoyens et… Data Scientists ! Voici quelques questions/réponses :

  • Comment expliquer une baisse de fréquentation des stations de ski ? #pasdeneige
  • Le rayon Glaces a surperformé en Juin, mais pourquoi ? #canicule
  • Les accidents de la route ont augmenté de 428% dans la région sur la première semaine de mars, que s’est-il passé ? #inondations

Dans le cadre d’une implantation d’un nouveau commerce ou d’une agence, on peut également utiliser les données socio démographiques pour « connaître » le chaland et ainsi proposer des services / produits mieux adaptés. En poussant ce raisonnement, on peut même imaginer utiliser ces données pour implanter notre magasin dans une ville plutôt qu’une autre.

Dans le secteur de l’assurance automobile, les données d’accidentologie, de météo et de prévisions de trafic peuvent également permettre de développer un scoring de « risque » et ainsi développer un service de prévention aux usagers. Ainsi, un petit message d’alerte aux usagers des secteurs géographiques concernés peut permettre de faire baisser le nombre d’accidents (et donc de sinistres à régler).

Les données partagées sont de natures très différentes (Santé, Transports, météo, Démographie…) et peuvent concerner chaque secteur d’activités. Il est crucial que vous vous concentriez sur les données disponibles et que vous étudiiez les opportunités qu’elles ouvrent à court terme, moyen terme et long terme pour votre organisation.

Avec l’open data, on peut rester sur notre faim… #frustration !

Lorsqu’on travaille avec des données publiques ouvertes, il faut apprendre à relativiser et à travailler dans des conditions parfois frustrantes. Au-delà du fait qu’il soit souvent difficile de trouver exactement le jeu de données qui nous convient, on peut être déçu de la fraîcheur des données. En effet, certains jeux de données ne sont que très rarement mis à jour (une fois par an, ou même jamais !).

Une autre source de frustration peut être le périmètre des données disponibles : certaines collectivités sont très actives, d’autres sont absentes sur data.gouv.fr. On peut donc se retrouver avec une étude pertinente grâce aux données ouvertes… mais exclusivement sur la ville de Rennes par exemple. Les  initiatives Open Data sont nombreuses, ce n’est pourtant que le début et une généralisation est encore à réaliser.

Comment récupérer ces infos et industrialiser les mises à jour ?

Cela reste un des enjeux majeurs : pouvoir accéder aux informations partagées, en temps réel et avec une qualité de données satisfaisante. Le défi est en grande partie relevé grâce aux APIs mises à dispositions par les acteurs et permettant d’interroger les bases de données des fournisseurs d’informations en direct. Bien entendu, il vous faudra peut-être monter en compétences sur les technologies permettant de dialoguer avec les APIs, mais le jeu en vaut très certainement la chandelle !  

Pour résumer, l’open data est une formidable opportunité favorisant l’innovation ou le développement de nouveaux services gratuits à destination des clients ou des partenaires. Quel que soit votre secteur, lancer des initiatives Open Data ou au moins effectuer une veille est un élément important pour construire ou garder un avantage concurrentiel. Sachez également que les bonnes idées fleurissent souvent au sein de votre organisation grâce à vos collaborateurs, alors pourquoi ne pas les faire participer à un « Open Data Challenge » pour qu’ils exploitent leurs idées ? C’est un excellent moyen de porter la stratégie de l’entreprise et de satisfaire vos collaborateurs ! #symétriedesattentions  

Quelques sources de références sur l'Open Data 

Mais il en existe encore d’autres, plus ou moins pertinentes selon votre métier !  

Régis, Data Scientist

Publié le 27/07/2017
Les articles similaires