Qu’est-ce qu’une API ?

Une API est une interface de programmation à laquelle nous pouvons nous connecter et envoyer des requêtes pour récupérer différents types d’informations.
 
Une API est liée à une base de données ou à un jeu de données. L’idée est donc de passer par cette interface de programmation, pour interroger la base de données et automatiser des travaux qui étaient réalisés manuellement précédemment.
 
Nous allons prendre un exemple pour mieux comprendre ce point.
 
Nous souhaitons nous connecter à l’API des jours fériés en France pour en récupérer la liste officielle.
 
Le lien et la documentation de cette interface sont disponibles ici :
 
Chaque API est régie par des règles. Il faut donc envoyer à l’API un message accepté pour qu’elle nous renvoie le résultat souhaité.
 
 
Ici, l’API a compris notre demande et nous a renvoyé le résultat souhaité.
 
 
Pour comprendre les requêtes transmises (données et explications des résultats disponibles), il faut se référer à la documentation de chaque API.
 
 
Dans cet exemple, nous sommes passés par Power Query pour exploiter ces données et récupérer automatiquement la liste des jours fériés.

Pourquoi parle-t-on d’API publiques ?

Il existe deux types principaux d’API :
  1. Les API privées
  2. Les API publiques ou ouvertes
Comme son nom l’indique, une API privée est limitée à une organisation.

Seuls les utilisateurs autorisés peuvent s’y connecter et exploiter les données.
Il faudra donc se connecter, avec un jeton d’authentification dans la plupart des cas (un « token » en anglais), qui aura été transmis par les administrateurs de l’interface.

À contrario, une API publique est ouverte à tous les utilisateurs.

Ils pourront se connecter autant qu’ils le souhaitent et envoyer des requêtes dans la limite de ce qui a été défini.
 

Autres points à bien comprendre sur les API

Chaque API autorise un certain nombre de requêtes (par minute, par heure ou par mois selon le cas).

Ces contraintes sont précisées dans la documentation, tout comme les données disponibles et les filtres de recherche possibles.

Dans certains cas, l’API sera gratuite à l’utilisation jusqu’à un certain nombre de requêtes par minute ou par mois.

Prenons l’exemple d’Open weather, disponible ici : https://openweathermap.org/

Cette application permet de récupérer des données météorologiques en temps réel, des prévisions météo ou des données historiques, en sélectionnant un emplacement géographique souhaité.

L’application Open Weather est gratuite dans ce cas, jusqu’à 60 requêtes par minute et 1 000 000 par mois. Au-delà, l’application sera bloquée, sauf si l’on fournit un jeton de connexion accepté par l’application.

Le temps d’actualisation des données et l’historique des données ne seront également pas les mêmes selon que vous utilisez la version gratuite ou payante.

Nous allons nous intéresser ici seulement aux API ouvertes ou publiques, gratuites quel que soit le nombre de requêtes réalisées.

Cadre législatif entourant les données publiques en France et en Europe

La plupart des données publiques accessibles sont produites par des collectivités et des établissements publics. On parle souvent dans ce cas d’« Open data ».

Il peut s’agir par exemples des données géographiques (adresses, localisation), financières (budgets, commandes publiques, subventions, etc.), environnementales (émissions, vente de produits, etc.), etc.

En 2007, la directive européenne INSPIRE (directive 2007/2/CE du Parlement européen) a été publiée.
Cette dernière visait à favoriser l’échange de données entre les différents membres de l’Union Européenne.
Il était alors obligatoire pour chaque État membre de publier les données environnementales et géographiques. C’était un premier pas vers la mise à disposition de données publiques.

La loi pour la République Numérique datant du 1er octobre 2016, encadre sa mise à disposition en France. Par défaut, les données publiques définies comme communicables, sont accessibles aux utilisateurs.
Il était prévu dans cette loi la mise en place d’une plateforme accessible à partir de 2018, data.gouv.fr qui existe depuis.

Panorama des données publiques accessibles en Europe et en France

Pour l’Europe, toutes les données sont centralisées sur un seul site :
https://data.europa.eu/en

Ce site offre énormément de jeux de données.
Il est possible de filtrer selon la catégorie, le pays ou le format de données disponibles.

Au niveau français, Etalab, un organe de l’administration française, coordonne la mise à disposition des données publiques. Etalab a créé un blog en 2019, pour communiquer sur les données accessibles : https://www.etalab.gouv.fr/

Le site suivant, recense toutes les API mises à disposition par le gouvernement français : https://api.gouv.fr/rechercher-api
Selon leur niveau de confidentialité, certaines données sont seulement accessibles aux administrations publiques.

Les administrations suivantes proposent entre autres, des jeux de données accessibles :

Pour l’INSEE, nous pouvons notamment :
  • Récupérer les données chiffrées des études produites (via les Bases de Données Macroénomiques produites par cet organisme)
  • Interroger la base Sirene, afin d’avoir des informations publiques sur une entreprise, grâce à son code LEI

Chaque région ou département de France propose également un portail avec les données accessibles aux utilisateurs. Par exemple, pour l’Ile de France, c’est accessible via le lien suivant : https://data.iledefrance.fr/pages/home-covid/

La plupart des grandes villes françaises proposent également un portail de connexion.
Par exemple pour Paris : https://opendata.paris.fr/pages/home/

Comme pour l’Union Européenne, le site suivant recense l’ensemble des jeux de données accessibles au niveau du gouvernement français : https://legacy.data.gouv.fr/fr/

Conclusion

De nombreuses ressources sont mises à disposition via l' »Open data », permettant de récupérer des données géographiques, sectorielles et financières, selon la granularité souhaitée.

Il paraît pertinent de les exploiter pour de multiples raisons :

  • Mieux comprendre ses clients et améliorer l’efficience des décisions stratégiques prises;
  • Enrichir les données en temps réel, en croisant les données d’une entreprise avec les données sectorielles ou géographiques pertinentes;
  • Automatiser des travaux d’enrichissement, réalisés précédemment manuellement;
  • Mettre en perspective les résultats de son entreprise, avec les données de sa région ou du département;
  • Récupérer des informations sur sa cible pour de la veille ou de la prospection;
  • Etc.

Nous continuerons à évoquer des thèmes autour de l’utilisation de données publiques, en utilisant différentes API disponibles dans une prochaine newsletter.

Si vous avez besoin d’exploiter ces différentes sources pour optimiser vos processus, nous pouvons vous aider chez Emargence.
N’hésitez pas à nous contacter pour plus de précisions.