Nouvelles données pour suivre la conjoncture économique pendant la crise sanitaire : quelles avancées ? Quelles suites ?
Transactions par carte bancaire, données de caisse, activations des réseaux de téléphonie mobile, consommation d’électricité, requêtes sur les moteurs de recherche… : les nouvelles sources de données massives et à haute fréquence issues de l’économie numérique ont-elles vocation à supplanter les enquêtes et sources administratives qui servent au suivi conjoncturel et à l’élaboration des comptes nationaux ? Cette thèse est parfois avancée et la crise peut sembler l’avoir renforcée. Ces sources se sont effectivement avérées très utiles au cours des derniers mois : elles ont permis de répondre à un besoin d’informations plus immédiates qu’à l’habitude, dans un contexte où la collecte de certaines données usuelles s’est trouvée en partie empêchée. Mais l’apport de ces sources ne peut être jugé en bloc, elles sont de différents types et ne répondent pas toutes aux mêmes besoins. Toutes n’ont pas la précision et la couverture requises pour une évaluation détaillée des comportements et de la situation financière de l’ensemble des agents économiques. L’expérience de la crise est l’occasion de remettre à plat les avantages et inconvénients de l’ensemble des données disponibles, nouvelles et traditionnelles, pour voir comment faire évoluer au mieux la boîte à outils du statisticien.
La crise sanitaire et le confinement à grande échelle de la population ont bouleversé le suivi de la conjoncture économique, poussant à l’utilisation accrue de données à plus « haute fréquence » que les données traditionnelles, lesquelles ne sont disponibles pour la plupart « que » mensuellement et dont les conditions de collecte se sont retrouvées très altérées par la fermeture de nombre d’entreprises. Pour rendre compte au plus vite d’un choc aussi soudain qu’inédit, il a fallu mobiliser d’autres données de natures assez diverses, disponibles quotidiennement et reflétant au mieux l’activité économique : montants agrégés des transactions par carte bancaire, données de caisse des grandes surfaces, fret ferroviaire, consommation d’électricité des entreprises, activations des réseaux de téléphonie mobile, nombres de recherches d’itinéraires sur internet, etc.
L’utilisation conjuguée de ces données à « haute fréquence », des remontées directes des fédérations professionnelles, mais aussi de ce que l’on savait sur les activités alors fermées réglementairement, a permis à l’Insee de publier, quelques jours après le début du confinement, une première estimation des pertes d’activité : environ un tiers, tant pour le PIB que pour la consommation des ménages. Par la suite, ces ordres de grandeur ont été affinés puis confirmés par les premiers chiffres « en dur » calculés à partir des sources de données traditionnelles. Et l’Insee a continué à mobiliser cet éventail de données pour suivre le rebond progressif de l’activité liée au déconfinement.
Des outils ayant aidé à parer à l’urgence, d’autres outils à potentiel plus pérenne…
La boîte à outils des conjoncturistes sera-t-elle modifiée par cet exercice, plus durablement que le choc économique lui-même ? Si tel doit être le cas, il faudra parler d’accélération d’un processus déjà engagé plutôt que de virage, car les conjoncturistes de l’Insee ou d’ailleurs n’ont pas attendu cette crise pour explorer les potentialités de ces données dites « massives ». Ce que cette exploration avait déjà montré est que ce terme de données massives recouvre des types de données assez hétérogènes, dont les apports doivent être évalués au cas par cas.
Il existe ainsi un relatif consensus sur le fait que les données issues des moteurs de recherche constituent un substitut utile aux données traditionnelles, tant que ces dernières ne sont pas encore disponibles, et ceci a été clairement le cas en début de crise ou pour mesurer le tout début de la reprise d’activité. L’Insee a notamment mobilisé ces données pour la comparaison de l’ampleur du choc puis de sa vitesse de sortie dans les différents pays, car un autre avantage de ces données est d’être directement accessibles pays par pays. Mais on savait aussi dès avant la crise que leur intérêt diminue ensuite largement lorsque les données « en dur » sont disponibles. Dans le même esprit, on peut certes observer en temps réel, par exemple sur des images satellitaires, les volutes de fumée qui s’échappent des cheminées d’usines, mais il peut y avoir loin de cette observation à la prévision du nombre de biens qui y sont effectivement produits et des chiffres d’affaires réalisés par les entreprises. Or in fine ce sont ces quantités dont on aura besoin pour apprécier l’ampleur du choc économique.
D’autres données nouvellement mobilisées à l’occasion de cette crise s’approchent bien davantage de ces quantités « en dur ». C’est le cas des données de caisse des enseignes de la grande distribution et des montants agrégés des transactions par carte bancaire. L’Insee mobilisait déjà les premières depuis le début de l’année pour une partie du calcul de l’indice des prix ; la crise a été l’occasion d’explorer aussi leur apport pour la mesure des quantités consommées, type de produit par type de produit. Les données de cartes bancaires ne permettent que des ventilations partielles de ces achats par grands types de produits, mais elles ont l’avantage d’une couverture plus large que le champ des grandes surfaces. Elles ont été beaucoup utilisées pour le suivi hebdomadaire voire journalier de la consommation, illustrant de manière très frappante le coup d’arrêt porté à certaines dépenses, le maintien voire l’intensification de certaines autres, incluant des effets de stockage en tout début de confinement. Elles ont aussi illustré les effets de report des achats en magasin vers les achats en ligne.
Ces deux sources figurent sans doute parmi les plus prometteuses car elles tirent parti de la dématérialisation de l’économie tout en retraçant au plus près les achats de biens et services qui constituent directement une partie de la consommation des ménages telle qu’elle sera ensuite mesurée par les comptes nationaux. On peut donc dire que les partenariats noués ou renforcés à l’occasion de la crise avec les producteurs de ces données constituent des avancées significatives, que l’on espère pouvoir pérenniser. D’autres sources à haute fréquence (données de fret, consommation d’électricité, données d’activation des réseaux de téléphonie mobile…) mobilisées à l’occasion de la crise, gagneraient aussi à continuer d’être explorées, pour ce qu’elles disent non seulement sur leur secteur mais aussi, indirectement, sur l’ensemble de l’économie, ou, s’agissant des données de téléphonie mobile, sur les déplacements domicile-travail et l’accroissement du télétravail.
… au côté desquels les enquêtes vont progressivement retrouver leur usage habituel
Au total, la crise a donc bien ouvert des portes sur de nouvelles sources statistiques, certaines plutôt à réserver pour les temps de crise, d’autres pouvant éclairer à la fois les temps de crise et les temps plus normaux. Des données qui sont affectées d’une forte volatilité naturelle sont utiles en présence d’un choc majeur qui dépasse cette volatilité mais le bruit de fond qui les affecte les rend moins lisibles et moins utiles quand la conjoncture revient un tant soit peu à la normale. C’est ce qui explique qu’elles n’améliorent que marginalement la qualité des prévisions à court terme en période « normale » c’est-à-dire hors crise. Le volume de demandes d’itinéraires sur Google n’est qu’un indicateur très imparfait et très bruité du nombre de personnes qui s’apprêtent à se rendre à leur travail ou dans des commerces. Le comptage de ces demandes n’est informatif que lorsqu’il y a plongée brutale de ces deux types de déplacements ou lorsqu’ils repartent suffisamment rapidement à la hausse, mais on ne peut se fier à ce genre d’information pour estimer des mouvements conjoncturels d’au plus quelques points de pourcentage. En revanche, même si ceci reste à confirmer, il est probable que les transactions par carte bancaire et les données de caisse pourront continuer à fournir des signaux informatifs sur la consommation des ménages, au-delà du « bruit » dont elles peuvent être affectées.
Rappelons également que ces innovations statistiques ne se substituent pas à l’analyse économique, mais doivent plutôt l’alimenter. Il ne s’agit pas d’utiliser cette multiplicité de nouveaux indicateurs dans une « boîte noire » susceptible, via tel ou tel algorithme, de calculer la croissance du PIB. L’exercice vise plutôt à mieux estimer les agrégats macroéconomiques que sont, en particulier, la production et la consommation, pour se rapprocher peu à peu du cadre cohérent proposé par la comptabilité nationale. Ce cadre constitue un premier pas vers l’analyse, et, de là, vers l’identification des meilleurs leviers de politique économique.
Les deux premiers moments de la crise, d’origine purement sanitaire, se prêtaient particulièrement bien à la mobilisation de données à haute fréquence traduisant tout d’abord la contraction soudaine et inédite de l’économie liée au confinement général de la population, puis le rebond en partie mécanique lié au déconfinement. Même si la situation sanitaire n’est pas encore stabilisée, il est probable que nous entrions maintenant dans une nouvelle phase où les déterminants de l’activité se déduiront d’une grille de lecture économique plus habituelle. À cet égard, les enquêtes de conjoncture de l’Insee qui sont parues la semaine dernière traduisent peut-être cette évolution. Par exemple, les entreprises industrielles y indiquent certes un fort rebond des perspectives d’évolution de la demande, lesquelles ne pouvaient pas tomber plus bas que pendant le confinement ; mais dans le même temps les difficultés de demande qui limitent la production actuelle sont déclarées en nette hausse, et les carnets de commande restent jugés peu garnis. Cela suggère que se renforce le risque d’un choc significatif de demande, au-delà du choc d’offre initial (maintenant en partie résorbé) qu’avait représenté la mise à l’arrêt volontaire d’une partie de l’économie. ■
Pour en savoir plus
- Blanchet D. et Givord P., 2017, « Données massives, statistique publique et mesure de l’économie », L’économie française – Comptes et dossiers, édition 2017, coll. Insee Références, pp. 59-77
- Bortoli C. et Combes S., 2015, « Apports de Google Trends pour prévoir la conjoncture : des pistes limitées », Note de conjoncture de mars 2015, Insee, pp. 43-56
- Coll., 2018 et 2019, « Big data et statistiques », Économie et Statistique-Economics & Statistics, n° 505-506 et 509
- Insee, 2020, « Que disent les données de transactions par carte bancaire sur les comportements de consommateurs confinés ? », éclairage du Point de conjoncture du 9 avril 2020
- Insee, 2020, « Que disent les données de production et de consommation d’électricité sur l’activité économique en période de confinement ? », éclairage du Point de conjoncture du 7 mai 2020
- Insee, 2020, « Fin mai, les trajets matinaux n’atteignaient que 60 % de leur volume habituel », éclairage du Point de conjoncture du 17 juin 2020
- Insee, 2020, « Les messages issus des articles de presse peuvent contribuer à prédire l’activité économique en temps réel », éclairage du Point de conjoncture du 17 juin 2020
- Insee, 2020, « Les données « haute fréquence » sont surtout utiles à la prévision économique en période de crise brutale », éclairage du Point de conjoncture du 17 juin 2020