L’agence a expliqué qu’un problème d’algorithme avait conduit à des doublons dans les remontées de tests, entraînant une surestimation du taux d’incidence et de positivité, « sans impact sur le suivi de la dynamique de l’épidémie » toutefois. Après correction, les nouveaux indicateurs sont désormais fiables, assure SPF.

Le diable se niche dans les détails, et les outils de Santé publique France n’échappent pas à la règle. Afin de suivre l’épidémie de Covid-19 et d’établir les indicateurs que sont les taux d’incidence, de positivité et de dépistage, l’agence s’appuie sur la base de données SI-DEP (système d’information de dépistage), qui centralise les tests et leurs résultats.

Depuis sa mise en service, la base a intégré, en plus des tests RT-PCR, les tests antigéniques et salivaires : une personne a pu être testée à plusieurs reprises, dans des endroits différents (pharmacies, laboratoires), avec des types de tests différents et dans des intervalles de temps courts.

Un algorithme trop strict



Afin de garantir la protection des données des personnes testées, un algorithme dit de « pseudonymisation » transforme par ailleurs les données (nom, prénom, âge, sexe) du patient en identifiant. Jusque-là, rien d’anormal. Mais l’agence a constaté en mars que l’algorithme était trop strict : lorsque les données n’ont pas été saisies exactement de la même façon, il a pu arriver que deux pseudonymes soient générés pour une même personne testée plusieurs fois, à cause d’accents ou de caractères spéciaux : Céline Dupont a pu ainsi être enregistrée deux fois, à la fois comme « Céline » et comme « Celine », sans qu’il soit possible de l’identifier comme un doublon.

Un problème apparu avec l’arrivée des tests de criblage et de séquençage en février, qui a débouché sur des erreurs : l’agence indique, après correction, que le taux d’incidence (pour la France entière) a été surestimé de 12 %, le taux de positivité de 8 %, et le nombre de cas confirmés de 6 %. Cependant, SPF assure que la comparaison des indicateurs produits avec l’ancienne et la nouvelle méthode « montre des courbes proches, sans conséquence sur la dynamique de l’épidémie, son suivi et son interprétation ». Les chiffres ont été repris et corrigés sur un historique de trois mois.