Statistiques sur les décès : le mode d’emploi des données de l’Insee en 7 questions/réponses
À l’heure des premiers bilans statistiques sur l’impact du Covid, les données de l’Insee sur la mortalité sont très largement utilisées. Les observateurs se posent parfois des questions sur leur fiabilité, leur bon usage et leurs limites, leur cohérence avec les chiffres des autorités de santé, leur comparabilité avec les données produites par nos voisins européens, etc. Les réponses dans cet article.
Depuis que l’Insee a décidé de publier, chaque semaine, les données les plus récentes sur les décès quotidiens, il a enrichi considérablement celles-ci : sont aujourd’hui diffusées la répartition des décès par département, par lieu du décès (hôpital, domicile, maison de retraite) ou encore selon l’âge et le sexe des personnes décédées. Même si ces données sont encore provisoires et soumises à révision, elles permettent de suivre l’évolution de la mortalité en France.
Ces chiffres ont été largement repris par la presse et commentés sur les réseaux sociaux. Dans la plupart des cas, leur mode d’emploi est bien compris. Les limites de ce qu’on peut leur faire dire aussi. Mais pas toujours.
Cet article revient sur les questions les plus sensibles et les plus fréquentes des utilisateurs et du public.
Pourquoi les données sur les décès diffusées chaque semaine par l’Insee sont-elles provisoires ?
En théorie, les communes disposent d’un délai légal d’une semaine pour transmettre à l’Insee les informations concernant les avis de décès qu’elles enregistrent. En pratique, plus de 90 % des décès sont transmis dans des délais très courts par les communes via des envois par procédure dématérialisée. Il reste néanmoins de nombreuses petites communes qui continuent à transmettre les informations à l’Insee via des formulaires papier. Ceux-ci sont alors acheminés par la Poste, puis récupérés dans les directions régionales de l’Insee pour être saisis avant d’être enregistrés. Les délais de prise en compte de ces décès sont alors plus longs, et peuvent être allongés avec le confinement.
Habituellement, l’Insee diffuse vers le 23 de chaque mois le nombre de décès du mois précédent au niveau national. Cette diffusion a un statut provisoire au sens où elle ne couvre pas la totalité des décès. Le taux de couverture au 23 avril était de 98,7 % pour les mois de mars 2018 comme 2019. Un mois plus tard, au 23 mai, la couverture du mois de mars s’améliore d’un point : le taux passe à 99,6 %. Il faudra parfois plusieurs mois pour couvrir les derniers décès. Ceux-ci peuvent être enregistrés beaucoup plus tardivement pour de multiples raisons, notamment des envois tardifs par des communes, mais aussi quelques jugements de décès à la suite d’une disparition par exemple.
Dans le cadre de la pandémie actuelle, les données sur les décès sont diffusées beaucoup plus rapidement et fréquemment : toutes les semaines des données sont extraites le jeudi, jour J, et diffusées jusqu’à J-10 pour les décès totaux. Par exemple, les décès totaux – hors Bouches du Rhône1 – de la semaine du 16 au 22 mars sont de 13 679 dans la dernière publication du 7 mai (avec des données extraites le jour même), de 13 659 la semaine précédente (extraction du 30 avril), donc presque stabilisés, mais ils étaient 12 578 lors de l’extraction du 2 avril qui a donné lieu à la première diffusion des données pour cette semaine-là, soit 92 % des décès enregistrés à ce jour (cf. figure 1).
Figure 1 – Évolution du nombre de décès quotidiens selon la date d’extraction (France hors département des Bouches-du-Rhône)
Conclusion : même avec un recul de 10 jours, il peut manquer environ 10 % des décès par rapport au nombre définitif.
À quoi peut-on comparer le nombre de décès de mars et avril 2020 ?
L’évolution de la mortalité depuis la mi-mars 2020 est exceptionnelle, comme en témoigne la courbe retraçant l’évolution du nombre de décès survenus chaque jour depuis le 1er janvier 2020 en comparaison des évolutions marquantes des soixante dernières années (cf. figure 2). Sur cette période, les deux autres événements exceptionnels en matière de décès quotidiens sont la canicule survenue à l’été 2003 et la grippe de Hong-Kong et ses nombreux morts de décembre 1969.
Les chiffres des décès quotidiens, mis en ligne chaque semaine, n’ont pas vocation à être directement interprétés en termes de surmortalité. Pour autant, il est normal de vouloir comparer le nombre de décès actuels à une référence. Mais laquelle ?
En mars 2019, les décès quotidiens s’élevaient en moyenne à 1 730 par jour, soit nettement en dessous des 1 950 décès observés en moyenne chaque jour de mars 2018 (l’épisode de grippe de l’hiver 2017-2018 ayant été particulièrement long et meurtrier comme le figure 2 l’illustre bien) et légèrement en dessous de la moyenne des cinq dernières années (1 760 décès). La raison principale de ces fluctuations est la saisonnalité et la virulence plus ou moins prononcée de la grippe hivernale, phénomène documenté chaque année par Santé publique France, qui en chiffre précisément l’impact en termes de surmortalité.
Figure 2 – Décès quotidiens chaque année depuis 2010
Choisir mars 2019 revient donc à choisir comme référence une année sans épisode de grippe à cette époque-là, se situant à peu près dans la moyenne des cinq dernières années. Choisir mars 2018 revient à choisir un point très haut de mortalité, le plus haut des cinq dernières années, mais aussi le plus haut depuis… 1946 ! L’avantage d’une référence en moyenne est de lisser les évolutions survenues dans le passé, et certains peuvent être tentés d’élargir la fenêtre au-delà des cinq dernières années. Dans ce cas, il faut cependant avoir en tête certaines difficultés d’interprétation. En effet, la population française s’accroît et surtout vieillit, ce qui va dans le sens d’une augmentation tendancielle des décès chaque année. Ce vieillissement est par ailleurs fortement accentué depuis 2010, avec l’arrivée à des âges de mortalité plus élevée des générations nombreuses du baby-boom. Même si l’augmentation de l’espérance de vie tempère l’effet du vieillissement sur l’augmentation du nombre des décès, les décès en mars moyennés sur les 10 ou 20 dernières années sont inférieurs d’environ une centaine par jour à ceux moyennés sur 5 ans.
Au total, le nombre de décès survenus en mars 2020 est supérieur de 8 900 par rapport à 2019, de 7 900 par rapport à la moyenne des 5 dernières années et bien davantage en prenant comme points de comparaison la moyenne des 10 dernières années (+ 9 900) ou des 20 dernières années (+ 12 400). En revanche, en prenant comme référence l’année 2018, particulièrement élevée en matière de mortalité, le supplément de décès en mars 2020 n’est « que » de 2 200.
Quant au mois d’avril, le nombre de décès par jour y est chaque année inférieur à celui de mars (1 620 par jour contre 1 760 en mars, en moyenne sur les cinq dernières années). Sa variabilité est aussi nettement moins importante (± 78 contre ± 360 décès par jours pour le mois de mars, en prenant deux écarts-types). Conséquence de cette moindre variabilité, l’excès de mortalité d’avril 2020 est moins sensible au point de référence. À la date du 27 avril 2020, cet excès de mortalité en avril est d’environ 15 200 par rapport à 2019, de 15 700 par rapport à la moyenne des cinq dernières années, et atteint 13 900 par rapport à 2018, sachant que le mois d’avril 2018 est le plus haut jamais enregistré.
Conclusion : même si la période de référence est une affaire de choix, celle qui permet d’approcher au mieux la « surmortalité toutes causes » consiste à retenir 2019 ou la moyenne 2015-2019. Depuis le 1er mars et jusqu’au 27 avril 2020, le surplus de décès par rapport à 2019 se chiffre provisoirement à 24 100, et à 23 600 par rapport à la moyenne des cinq dernières années. Ces deux références fournissent un ordre de grandeur équivalent.
Pourquoi ne pas comparer la totalité des décès depuis janvier ?
En janvier et février 2020, il y a eu un jour de plus (année bissextile) mais moins de morts qu’en 2019 (– 7 800). De ce fait, certains considèrent que des décès, qui auraient pu avoir lieu ou être accélérés en janvier/février 2020 si l’épisode de grippe avait été important, le sont en mars 2020 en raison du Covid-19. Ils plaident pour débuter les comparatifs de décès au 1er janvier.
Cela étant dit, ce n’est pas parce que certaines années les épisodes de grippe sont moins sévères (notamment en janvier et février), qu’il y a plus de décès à la sortie de l’hiver. Il suffit de prendre l’exemple de l’année 2014, avec des décès survenus en janvier et février plus faibles d’environ 10 000 par rapport à la moyenne des 10 dernières années. Les décès du mois d’avril se sont aussi avérés inférieurs. Par ailleurs, certaines années, les épisodes de grippe débutent en décembre. Pourquoi ne pas remonter alors jusque-là ?
Ces discussions sur le choix de la date de comparaison ont en trame de fond le souhait de comparer la mortalité occasionnée par le Covid-19 à celle d’autres épisodes de grippe saisonnière alors que les choses ne sont en rien comparables. Dans un cas, on observe un nombre de morts dans un contexte de confinement. Dans l’autre, une mortalité due directement ou indirectement à des grippes saisonnières, dans un contexte de liberté de déplacement des personnes, dont une bonne part sont immunisées ou vaccinées.
Conclusion : il apparaît donc pertinent de démarrer la comparaison avec le calendrier de l’épidémie, soit au 1er mars.
Les décès supplémentaires de mars-avril 2020 par rapport à 2019 sont-ils entièrement dus au Covid ?
Avec environ 24 000 décès supplémentaires entre le 1er mars et le 27 avril, cet excès de mortalité évoluant avec le calendrier de l’épidémie, il est évident qu’il existe un lien entre l’« excès de décès » relevé par l’Insee dans ses publications hebdomadaires et l’épidémie de Covid 19. La cohérence entre les zones les plus touchées par l’épidémie et les départements qui subissent les plus fortes hausses du nombre de décès apporte une preuve supplémentaire en ce sens.
Pour autant, faire le lien un pour un entre ces décès supplémentaires et la mortalité due à l’épidémie ne va pas de soi : la période depuis le 17 mars est atypique parce qu’elle cumule l’effet d’une épidémie inédite et celui de la mise en place d’un confinement, avec ses conséquences réelles ou supposées sur les différentes causes de décès : en premier lieu, une diminution de la transmission des maladies virales (dont c’est le but), mais aussi une moindre pollution, une vie au ralenti avec moins d’accidents mais sans doute davantage de stress, des effets éventuels de plus long terme avec notamment des reports de diagnostics ou de soins pour des cancers, chaque composante étant difficile voire impossible à chiffrer. Ainsi, si l’on sait mesurer précisément l’effet modeste sur les accidents de la route (108 tués en moins en mars 2020 par rapport à mars 2019), les autres effets seront beaucoup plus compliqués à évaluer.
Conclusion : la « surmortalité toutes causes » observée à ce jour (24 000 décès supplémentaires environ du 1er mars au 27 avril) est indéniablement liée à l’épidémie de Covid-19. Mais chiffrer précisément ce qui relève strictement du Covid est aujourd’hui impossible car les autres causes de décès ont pu évoluer à la hausse comme à la baisse, notamment avec la mise en place du confinement.
Cet excès de mortalité est-il cohérent avec le nombre de décès remontés quotidiennement par la direction générale de la Santé ?
De nombreux observateurs ont, dès lors, cherché à rapprocher les décès quotidiens rapportés par l’Insee des comptages opérés chaque jour dans les hôpitaux, et désormais dans les maisons de retraite, concernant les décès imputés au Covid.
Il est en effet tentant de comparer cet excès de décès de 24 000 environ au 27 avril, au nombre de morts Covid rapportés par la direction générale de la Santé à cette date : 14 497 à l’hôpital et 8 796 en maison de retraite, soit environ 23 300 au total. Les décès liés Covid survenus à domicile ne sont pas identifiés à ce jour.
Peut-on considérer que les décès liés au Covid à domicile correspondent à la différence, soit moins de 1 000 décès au 27 avril ?
La réponse n’est pas si simple. L’Insee publie aussi la répartition des décès selon le lieu : hôpital, maison de retraite, domicile ou autre. Cette dernière catégorie comprend les « lieux non renseignés », ce qui ne facilite pas l’analyse, même si sa part est stable au niveau national, à environ 10 % des décès en 2020 comme en 2019. Entre 2019 et 2020, l’Insee enregistre environ 6 300 décès supplémentaires à domicile entre le 1er mars et le 27 avril. Cette croissance des décès à domicile suit pour partie la géographie de l’épidémie. Néanmoins, on observe une croissance significative des décès à domicile dans des régions peu touchées : dans les Pays de la Loire, les décès à domicile entre le 1er mars et le 27 avril sont en hausse de 21 % par rapport à 2019, contre + 11 % seulement pour le total des décès ; en Nouvelle-Aquitaine, + 10 % alors que les décès n’augmentent que de 3 % au total. Et parmi les régions les plus touchées, il peut y avoir évolution similaire des décès à l’hôpital et à domicile (environ + 45 % dans les deux cas dans le Grand Est) ou des différences : + 66 % à l’hôpital, + 98 % à domicile en Île-de-France.
C’est certainement sur l’excédent des décès à domicile que l’analyse des causes a le plus besoin d’être menée, en lien sans doute avec l’évolution des décès à l’hôpital. En effet, du 1er mars au 27 avril, l’Insee a enregistré seulement 8 900 décès de plus qu’en 2019 à l’hôpital, pour 14 497 décès « Covid » répertoriés : l’« excès de décès » à l’hôpital dans les données d’état civil est bien inférieur au nombre de morts liés au Covid recensés dans les hôpitaux. Cet écart pourrait s’expliquer par un report d’autres causes de décès vers le domicile, autrement dit, des décès ayant eu lieu à l’hôpital en 2019 – donc hors Covid – ont eu lieu à domicile en 2020. De sorte qu’on ne peut pas attribuer au Covid tout le surplus de décès observé à domicile. C’est ainsi que l’AP-HP a publié le 22 avril un communiqué de presse invitant les franciliens à ne pas renoncer aux urgences médicales ni aux soins courants, sur la base des observations suivantes : à l’AP-HP du 15 au 30 mars 2020, le nombre d’appendicites prises en charge par cœlioscopie a diminué de 35 % par rapport à la même période en 2019. Au 14 avril 2020, le nombre d’accidents cardio-vasculaires accueillis dans les services d’urgence est inférieur de 15 % sur les 7 derniers jours par rapport à la même période l’an dernier ; celui des cas de colique néphrétique de 23 %. Au total, au sein des différents hôpitaux de l’AP-HP, depuis la mi-mars 2020, les passages aux urgences ont chuté de 45 % pour les adultes et 70 % pour les enfants par rapport à l’an dernier à la même période.
Santé publique France fait le même constat, sans qu’il soit possible à ce stade de déterminer précisément ce qui correspond à une moindre occurrence de ces pathologies qui pourrait être attribuée au confinement, et peut-être in fine une moindre mortalité pour certaines causes hors Covid, et ce qui correspond à un renoncement à rejoindre les urgences, par peur notamment d’être mis en contact avec le virus.
Par ailleurs, dans un contexte d’encombrement des hôpitaux dans certaines régions et notamment en île-de-France, il est possible que certains malades en fin de vie soient restés à domicile ou en maison de retraite plutôt que d’être pris en charge à l’hôpital. Dans les maisons de retraite, l’excès de décès est également inférieur aux « décès Covid » rapportés par les autorités : le cumul de plusieurs facteurs (comorbidité) étant fréquent pour les personnes âgées, il est possible que le Covid n’ait été, dans certains cas, qu’un facteur « aggravant ».
Cette analyse des causes de décès des morts à domicile et dans les autres lieux pendant la durée de l’épidémie reposera sur les données issues de la certification des décès, procédure hélas peu dématérialisée, ce qui explique que les données quotidiennes de la direction générale de la Santé ne puissent pas en faire état à ce jour. Dans son calendrier habituel, cette analyse des causes de décès n’est disponible qu’avec un délai de plusieurs années. Contrairement à d’autres instituts statistiques, l’Insee n’est pas destinataire du volet médical du certificat de décès.
Conclusion : en France, l’excédent de décès pris dans son ensemble est cohérent avec les données relatives au comptage quotidien des autorités de santé. Néanmoins, des différences notables sont observées selon les lieux de décès, sans qu’il soit possible de mesurer à ce jour l’incidence des autres facteurs de morbidité, et celle des comportements des malades. Dans ce contexte, il serait utile que l’Inserm puisse rapidement communiquer de premières analyses sur les causes de mortalité en mars et avril 2020 à partir des volets médicaux des actes de décès.
Comment font les autres pays pour compter les décès et comparer avec les chiffres publiés par les autorités de santé ?
Les difficultés rencontrées en France sont les mêmes que dans les autres pays.
Plusieurs observateurs ont cherché à relever les écarts entre les chiffres rapportés par les autorités de santé et les calculs d’excès de mortalité.
Pour faire simple, le premier chiffre, celui des décès du Covid comptabilisés par les autorités de santé, est généralement précis mais partiel. Entre les pays européens, la différence principale porte sur la prise en compte ou non des décès dans les maisons de retraite et au domicile, avec des performances de suivi variables d’un pays à l’autre.
Ce chiffre est également dépendant de la politique de chaque pays en matière de dépistage et de suivi de la maladie, et évidemment de la volonté de transparence des autorités. Il peut être sujet à interprétation lorsque plusieurs pathologies sont concomitantes.
Bref, c’est un chiffre en apparence simple et fiable, mais en apparence seulement.
Le second, celui de l’excès de mortalité, est rarement disponible de façon rapide, exhaustive et centralisée, et surtout il peut être calculé selon différentes modalités comme on l’a montré plus haut.
En Europe existe un réseau EuroMomo, auquel la France contribue via Santé publique France, qui suit l’apparition d’ « excès de mortalité » en utilisant un même modèle statistique.
Figure 3 – Carte européenne EuroMomo des excès de mortalité (semaine du 6 au 12 avril 2020, données arrêtées au 22 avril)
La principale limite de ce modèle est qu’il repose sur des données partielles pour chaque pays ou zone. Par exemple, en France il ne couvre que 77 % des décès, correspondant aux communes qui transmettent les actes d’état civil de façon dématérialisée depuis plusieurs années. Dès lors, il ne fournit pas directement des nombres de décès en excès, mais seulement un indicateur de surmortalité issu du modèle.
De ce fait, pour faire des calculs comme ceux développés plus haut, des journalistes ont plutôt utilisé des données sur le total des décès, lorsqu’elles existent comme en France, pour les comparer au nombre de morts Covid rapportés par les autorités de santé.
The Economist et le New York Times (NYT) notamment ont rassemblé les données disponibles sur les décès. Ils ont décidé de comparer les chiffres 2020 à la moyenne d’années antérieures pour approcher comme on l’a fait plus haut la « surmortalité toutes causes », et ont comparé les « morts Covid » (à l’hôpital et dans les autres lieux lorsqu’ils sont pris en compte) à cette « surmortalité », arrêtée selon les pays entre le 4 et le 12 avril. The Economist a ainsi pointé des écarts allant de 22 % du total des décès en excès en France, à 56 % aux Pays-Bas, en passant par 35 % en Espagne et 52 % en Lombardie.
Pour le cas de la France, ces calculs sont fiables et sont cohérents avec ce qui a été proposé plus haut, même si l’interprétation en termes de sous-déclaration des « morts Covid » peut être discutée, comme on l’a signalé plus haut. Au demeurant, le taux de 22 %, correspondant à l’écart mesuré à la date du 6 avril, ne serait plus que de 5 % environ fin avril. .
L’institut de statistique Italien observe de son côté que pour la période comprise entre le 20 février, lorsque le premier malade italien est signalé, et le 31 mars, la hausse de la mortalité est de 38,7 %, avec 25 354 décès supplémentaires par rapport aux cinq années précédentes. Parmi eux, « la mortalité « directe » qu’il est possible d’attribuer au Covid-19 (…) est d’environ 13 700 décès », ce qui fournit un ordre de grandeur également cohérent avec The Economist. Sur cette période au moins, les décès Covid comptabilisés en Italie ne prennent pas en compte les décès en dehors de l’hôpital.
Conclusion : en dehors de l’Allemagne, l’épidémie a touché de façon importante la plupart des pays d’Europe de l’Ouest entre mars et avril 2020, avec des effets très significatifs sur la mortalité. La non prise en compte des décès à domicile et surtout en maison de retraite peut expliquer des écarts importants entre l’excès de mortalité observé et le nombre de décès attribués au Covid par les autorités de santé.
Quels autres enseignements nous apportent ces nouvelles données mises à disposition toutes les semaines ?
La mise à disposition de données issues de l’état civil sur les décès, toutes causes confondues, par département a permis de suivre avec précision les évolutions de la pandémie. Au début de cette diffusion, le 27 mars, le nombre de décès cumulés entre le 1er mars et le 23 mars était légèrement supérieur à 2019 (+ 4 %) mais encore inférieur à 2018 (– 8 %) (cf. cartes ci-dessous). Les régions Grand Est et Île-de-France apparaissaient comme les plus touchées avec des décès supérieurs de respectivement 19 % et 10 % à 2019. Au fur et à mesure de nos publications hebdomadaires, nous avons pu constater la propagation de l’épidémie à d’autres régions mais aussi l’accroissement du surplus de mortalité dans les deux régions les plus concernées avec + 55 % dans le Grand Est sur la période du 1er mars au 27 avril 2020 par rapport à la même période de 2019 et + 90 % en Île-de-France. Mais ces données ont aussi permis de détecter les premiers signes de ralentissement de l’épidémie d’abord dans le Grand Est dès début avril, puis dans d’autres régions avec des reculs du nombre de décès d’une semaine sur l’autre parfois très forts. Ainsi en Île-de-France, entre le 11 et le 17 avril, le nombre de décès a diminué de 23 % par rapport à la semaine précédente et cette inflexion était déjà visible dans la publication du 24 avril grâce aux données dématérialisées.
L’Insee a ensuite enrichi ses analyses en mettant à disposition rapidement des données sur les évolutions du nombre de décès toutes causes confondues par sexe, âge et lieu de décès. Cela a permis par exemple de confirmer que l’accroissement par rapport à 2019 était plus fort pour les hommes que pour les femmes et en particulier dans les départements les plus touchés par l’épidémie de Covid-19. Mais pas dans tous : la surmortalité masculine ne s’observe pas dans le Haut-Rhin ni dans le Bas-Rhin. Les données ont également confirmé un surplus de décès plus marqué chez les plus de 75 ans sans différences toutefois entre les 75 et 84 ans et les plus de 85 ans.
Enfin, l’analyse des lieux de décès a révélé que la hausse des décès était nettement plus forte en maison de retraite (+ 52 % au 7 mai pour une moyenne de + 24 %) que dans les autres lieux (hôpitaux ou clinique, domicile ou autre), et cette hausse des décès en maison de retraite est plus forte pour les personnes âgées de 65 à 74 ans que les plus de 75 ans. À domicile, la hausse de mortalité est plus marquée pour les femmes très âgées, à l’hôpital pour les hommes. Attention toutefois aux conclusions hâtives : ces résultats peuvent être dus aux effets de l’épidémie dans certains établissements, mais aussi au fait que les malades en fin de vie, atteints ou non du Covid, ne sont plus accueillis de la même façon en cette période à l’hôpital. Toutes ces données sont donc essentielles mais nécessitent d’être confrontées à d’autres et il est nécessaire de prendre du recul dans leurs analyses pour ne pas risquer des interprétations trop rapides.
Conclusion : l’Insee apporte une contribution importante au débat avec des analyses sur les lieux de décès. Il développe aussi de nouvelles approches mobilisant des données complémentaires à celles de l’état civil avec des questions du type : y a-t-il un lien entre la densité des territoires et l’augmentation du nombre de décès ? À suivre… sur insee.fr. ■
- La comparaison est effectuée ici hors Bouches-du-Rhône en raison de problèmes spécifiques de transmission des données sur les décès ayant affecté la commune de Marseille en mars 2020. ↩︎
Pour en savoir plus
- Covid 19, point épidémiologique du 30 avril (la publication dont est issue la carte EuroMomo)
- Publication hebdomadaire des décès sur www.insee.fr
- Noël Gascard, Bertrand Kauffmann, Aline Labosse, « 26 % de décès supplémentaires entre début mars et mi-avril 2020 : les communes denses sont les plus touchées », Insee Focus n° 191, 11 mai 2020
- Alain Bayet, Sylvie Le Minez et Valérie Roux, « Mourir de la grippe ou du coronavirus : faire parler les chiffres de décès publiés par l’Insee… avec discernement », blog de l’Insee, 7 avril 2020
- Cartes publiées chaque semaine depuis le 27 mars par l’Insee