22 octobre 2020
Partagez

Présentation de Valérie Plagnol

Avec l’automne, est arrivée une deuxième vague d’infections qui touche particulièrement l’Europe. Du fait de l’augmentation du nombre de tests, la reprise des activités et la mesure de la gravité du phénomène restent difficile à apprécier et l’on sent une certaine lassitude dans les opinions.

La pandémie a été l’occasion de recourir à des outils de mesure en temps réel de l’activité. Réconcilier les modèles statistiques traditionnels avec le big data reste un défi encore complexe.

 

 

 

Sur le plan économique, les réunions d’automne du FMI et de la Banque Mondiale sont l’occasion de la publication de leurs prévisions semestrielles. Celles-ci témoignent du risque languissant sur l’activité économique, alors que l’encours des dettes publiques augmente globalement.

A la veille des élections présidentielles américaines, nous prenons le temps de faire le point sur l’état de l’économie du pays.

Cette crise a modifié la manière dont nos instituts utilisent et exploitent les données à leur disposition afin d’analyser la conjoncture économique. Face à la soudaineté et à l’ampleur de la propagation de la pandémie, le besoin de capter et de mesurer non seulement sa progression, mais aussi l’impact sur l’activité au plus près, s’est fait sentir avec encore plus d’acuité. Nos instituts de statistiques ont alors commencé à incorporer de nouvelles données dans leur arsenal de mesures de la conjoncture. Mais ces indicateurs restent imparfaits et leur valeur prédictive encore bien médiocre.

Parmi les données dites à haute fréquence, l’INSEE a par exemple eu recours aux données fournies par Google Mobility afin de mettre rapidement en évidence l’impact du confinement sur l’activité des personnes. Comme le montre le graphique ci-dessous, entre le 17 mars et le 13 mai dernier, la fréquentation des lieux publics, l’usage des transports et même les passages dans les supermarchés se sont effondrés, tandis qu’on pouvait constater une augmentation concomitante de la présence à la maison. De même, dès la fin du déconfinement, l’explosion de la fréquentation des parcs et espaces verts a montré l’ampleur du « besoin d’air frais » ressenti par la population.

Mobilité en France

 

Les données en temps réel sont donc utiles pour suivre l’évolution des comportements, et pour estimer l’impact de telles ou telles mesures.

 

Recoupées avec d’autres données issues notamment des paiements, on a pu établir que la baisse de la fréquentation des commerces restés ouverts (supermarchés, pharmacies) s’était accompagnée d’une hausse de prix du panier moyen d’achats. C’est également à partir de ces données, recoupées avec d’autres relevés statistiques traditionnels – que les instituts cherchent à mesurer l’ampleur des pertes ou d’accroissement d’activité, et leurs conséquences économiques globales. Cependant, l’extrapolation des données reste délicate.

L’exploitation seule de ces données trouve encore de nombreuses limites. Comme le signalent d’ailleurs leurs producteurs eux-mêmes, elles sont entachées de nombreux biais, qu’il est difficile de « lisser ».

  • Les relevés sont encore parcellaires et dépendent non pas du tri a priori d’un « panel représentatif », mais de données recueillies pêle-mêle parmi les personnes connectées. Paradoxalement, la masse pourtant imposante d’informations recueillies reste donc encore fragmentaire et sujette à caution du fait de leur caractère aléatoire.
  • De plus, ces données concernent essentiellement la consommation et ne reflètent pas l’évolution des productions.
  • Enfin, la collecte en temps réel reste également soumise à un fort aléa humain. Qui a le temps de répondre à telle ou telle question en période d’urgence ?
    • Ainsi, une enquête américaine a révélé que l’absence de protocoles préalables, propres à recenser en temps réel les lits occupés dans les établissements d’une même région, n’a pas permis d’organiser efficacement des délestages[1].
    • De même, dans l’urgence, il s’est avéré difficile de demander et d’obtenir des personnes normalement en charge de ces tâches, de relever et comptabiliser certaines données comme les inscriptions au chômage partiel.

    Il ne fait pas de doute que la statistique traditionnelle va progressivement s’enrichir de l’afflux du « big data » alors que la collecte de données ne fait que croître.

     

    Pourtant, celle-ci reste encore imparfaite et les deux mondes difficilement réconciliables, ce qui limite encore le champ de la prospective. A mesure qu’augmente le flux d’informations, leur traitement et leur analyse se font plus parcellaires et semble-t-il moins généralisables. De leur côté, les données statistiques officielles ont le mérite de la justesse, mais le retard de leur publication en limite l’efficacité en situation de crise. Se pose également la question du respect de la vie privée et de la protection des données personnelles. Celle-ci est devenue un enjeu majeur de tous les relevés de mesure. Réconcilier ces deux branches de la statistique est encore en devenir.

    [1] « Broken Data Systems Stymies Hospitals, the covid Storm », Melanie Evans, Alexandra Berzon, the WSJ 10/1/2020

     

    Article rédigé le 19 octobre 2020 par Valérie Plagnol, Économiste et Membre du Haut Conseil des Finances Publiques