Corona-Tests sind zu selektiv, um auf tatsächliche Infektionszahlen zu schließen

(lifePR) ( Berlin, )
Spätestens seit Ende März ist die Corona-Krise endgültig in Deutschland angekommen. Unklar ist aber bis heute, inwieweit die offizielle Fallzahl die tatsächliche Entwicklung der Epidemie widerspiegelt. Nutzen und Kosten einer möglichen Lockerung der einschränkenden Maßnahmen können allerdings nur dann sinnvoll betrachtet werden, wenn die Zahl der Erkrankten und die aktuelle Infektionsgeschwindigkeit bekannt sind. Gleichermaßen benötigen die Gesundheitssysteme in Deutschland und Europa Informationen über die Ausbreitung der Epidemie, um Kapazitäten anzupassen und die Versorgung der Patienten sicherzustellen. Die Entscheidungskriterien, welche Menschen getestet werden, sind in den europäischen Ländern, aber auch innerhalb Deutschlands sehr unterschiedlich. Die derzeit verfügbaren Informationen zu den getesteten Personen sind unzureichend – und damit keine angemessene Grundlage für informierte politische Entscheidungen.

Tests auf den SARS-CoV-2 Virus erfüllen derzeit zwei unterschiedliche Funktionen: Einerseits dienen Tests der Diagnostik, um individuelle COVID-19-Fälle zu erkennen; andererseits werden Fallzahlen, also Testergebnisse, als Datenbasis verwendet, um den Verlauf der Epidemie nachzuvollziehen. Durchgeführt werden Tests in Deutschland allerdings ausschließlich aufgrund ihrer diagnostischen Funktion. Dadurch unterliegen Testungen und die damit verbundenen gemeldeten Fallzahlen einer Selektion von Patienten. Diese Selektion bedeutet, dass bei bestimmten Personen eine höhere Wahrscheinlichkeit besteht, dass sie getestet und ihre Infektion diagnostiziert wird.

Zahl tatsächlicher Infektionen ist durch Selektion schwer nachvollziehbar

Ist eine Testung mit Kosten verbunden oder ist die Anzahl möglicher Tests begrenzt, müssen Entscheidungen darüber getroffen werden, wer getestet wird. Der rein diagnostische Test an sich verfügt über keinen unmittelbaren Direktnutzen. Stattdessen ist das Testergebnis relevant, denn auf diesem basiert, wie Patienten am besten behandelt werden können. In der Regel werden stärkere Folgemaßnahmen benötigt, wenn ein Testergebnis positiv ausfällt. Dadurch hat eine Testung immer dann einen höheren informativen Wert, wenn sie unter ansonsten gleichen Bedingungen mit einer höheren Wahrscheinlichkeit positiv ausfällt. [1]
Allerdings ist die Entscheidung zur Testung nicht nur patientenabhängig. Das Ausmaß der Selektion wird durch Testkapazitäten, Präferenzen, Kosten sowie der Verfügbarkeit von Diagnostiken im Vorfeld einer Labortestung bedingt.[2] Die Selektivität von Testungen hat zur Folge, dass aus reinen Fallzahlen, also bestätigten Positivergebnissen, nur wenig Information über tatsächliche Infektionszahlen gewonnen werden können.

Erhebliche Unterschiede in den Teststrategien verschiedener Länder

Ein zentraler Bestandteil der öffentlichen Diskussion sind die Erfahrungen anderer Länder mit der Epidemie. Betrachtet man die Entwicklung der gemeldeten COVID-19-Fallzahlen relativ zur Einwohnerzahl für einige ausgewählte Länder, für die Testinformationen vorliegen, verzeichnen Deutschland und Frankreich ähnliche Verläufe (Abbildung 1). In Italien, Belgien und den Niederlanden werden im Vergleich höhere, in Südkorea niedrigere relative Fallzahlen gemeldet.

Der Ausgangspunkt ist bei allen der Zeitpunkt, an dem der erste Fall auf eine Million Einwohner bestätigt wurde. Allerdings unterscheiden sich die Länder stark in der Zahl ihrer gemeldeten Testungen (Abbildung 2, links). So wurden in Deutschland, relativ zur Einwohnerzahl, bisher doppelt so viele Testproben untersucht wie in Belgien. Auch in Italien wurden bisher vergleichsweise viele Testungen durchgeführt, allerdings stieg die Zahl der Testungen erst spät an. In Südkorea wurde eine große Zahl an Personen getestet, während in den Niederlanden und Frankreich weniger getestet wurde. Dagegen verzeichnen die Niederlande und Frankreich hohe Positivraten von über 20 Prozent (Abbildung 2, Panel rechts), das heißt in beiden Ländern hatte im Schnitt eine von fünf getesteten Personen tatsächlich eine SARS-CoV-2 Infektion. Im Vergleich fielen in allen bisherigen Testproben in Deutschland nur etwa 7,1 Prozent positiv aus.

Hohe Positivraten legen nahe, dass an Kapazitätsgrenzen getestet wird oder dass Tests mit hohen Kosten verbunden sind. Gleichermaßen könnten sie aber auch darauf hindeuten, dass besonders erfolgreich Diagnostiken im Vorfeld einer Testung eingesetzt werden. Eine Interpretation wird dadurch erschwert, dass in der Regel nicht von allen testenden Laboren Daten vorliegen und sich die angegebenen Testeinheiten verschiedener Länder unterscheiden.

Ohne einheitliche Testungen sind internationale Vergleiche von Fallzahlen irreführend

Nicht nur die reinen Fallzahlen unterscheiden sich zwischen den Ländern, sondern auch die Verteilung der Fallzahlen auf Subgruppen innerhalb der Bevölkerung. Ein Beispiel ist der Anteil von älteren Personen, eine der Risikogruppen (Abbildung 3). In Belgien, wo vergleichsweise wenig getestet wird (Abbildung 2), stellt die Gruppe der über 60-Jährigen 46,1 Prozent der COVID-19-Fälle, fast 20 Prozentpunkte höher als ihr Anteil in der Gesamtbevölkerung. In Deutschland stellt die Gruppe der älteren Personen dagegen einen zur Bevölkerung geringeren Anteil der bisherigen Fälle.

Häufig werden Unterschiede in der Verteilung der Infektionszahl auf die Altersgruppen als Grund für die unterschiedliche Mortalität verschiedener Länder genannt.[5] Eine solche Interpretation setzt allerdings voraus, dass Personen in den Subgruppen tatsächlich in demselben Verhältnis erkranken, wie sie auch getestet werden. Variieren die Testbedingungen verschiedener Länder, muss mit Unterschieden in der Selektivität der Testungen gerechnet werden. In besonders selektiven Regionen würden Patienten mit schwereren Verläufen, für die ein Test mit höherer Wahrscheinlichkeit positiv ausfällt, und Risikopatienten, für die eine Diagnose größere Vorteile bringt, eher getestet. In diesen Regionen bleiben Fälle mit milden Verläufen eher unentdeckt.

Internationale Unterschiede in der Verteilung der Fallzahlen auf Subgruppen können sowohl auf Unterschiede im Infektionsgeschehen als auch auf Unterschiede in den Teststrategien hindeuten. Zugleich können über gemeldete Todeszahlen nur eingeschränkt Aussagen über das Infektionsgeschehen in Nicht-Risikogruppen getroffen werden. Ohne eine Vereinheitlichung der Datenbasis besteht wenig Möglichkeit, Informationen über den Verlauf der Epidemie aus den Statistiken anderer Länder zu gewinnen.

Selbst Fallzahlen innerhalb Deutschlands sind nur bedingt vergleichbar

Testungen in unterschiedlichen Regionen hängen stets von den dortigen Kapazitäten und Testkriterien ab. Auch innerhalb Deutschlands finden sich regionale Unterschiede: Mit einer Positivrate von 11,8 Prozent aller bisherigen Testungen verzeichnet Hessen den höchsten Anteil positiver Testergebnisse, während dieser Anteil für Schleswig-Holstein und Thüringen unter drei Prozent liegt.[6]

Zudem hat sich auch auf Bundesebene die Teststrategie im Verlauf der Zeit geändert. Die Empfehlungen des Robert Koch-Instituts bezüglich einer diagnostischen Abklärung von COVID-19 wurden zwischen Mitte Februar und Ende März mehrfach aktualisiert (Tabelle). Durch die Aktualisierungen der Testkriterien ändert sich bei vielen Subgruppen in der Bevölkerung die Wahrscheinlichkeit einer Testung. Der Grund für diese Aktualisierungen liegt sicherlich in der dynamischen Entwicklung der Epidemie. Die Absicht, begrenzte Testressourcen optimal zu verteilen, steht dann jedoch im Konflikt mit dem Ziel, Rückschlüsse auf die tatsächliche Infektionszahl zu treffen.
                                                                                                                  

Fazit: Repräsentative Stichproben in regelmäßigen Zeitabständen wünschenswert

Für die Umsetzung von politischen Maßnahmen, die auf Infektionszahlen basieren, sind repräsentative Stichproben unabdingbar. Wenn Testergebnisse zu Aussagen über die tatsächliche Infektionszahl und die Infektionsgeschwindigkeit führen sollen, muss die Selektivität von diagnostischen Tests korrigiert werden. In der empirischen ökonomischen Literatur sind unterschiedliche Lösungsansätze bekannt. Häufig sind Informationen über verpasste Diagnosen entscheidend, also über Patienten, die erkrankt sind, ohne auf die Erkrankung getestet zu werden.[7] Anderenfalls ist eine Randomisierung von Patienten auf Testungen nötig.[8] 

Es ist bedauerlich, dass die Leitung des Robert Koch-Instituts die Aussage trifft, repräsentative Studien mit randomisierten Testungen seien „nicht sehr zielführend“, da in Deutschland großflächig getestet werde.[9] Aufgrund der Selektivität der Tests ist es unerheblich, wie groß die Stichprobenzahl ist, solange Testressourcen begrenzt sind. Auch die Testung von Proben freiwilliger Blutspender ist problematisch, da es sich bei ihnen um eine hochselektierte Gruppe handelt.

Nur bei regelmäßig wiederholten, auf regionaler Ebene randomisierten Stichproben können zeitnah Aussagen über die tatsächliche Entwicklung der Epidemie getroffen und von Unterschieden in den Teststrategien getrennt werden. Regionale und bundesweite randomisierte Antikörperstudien, wie sie das Robert Koch-Institut derzeit plant, helfen zwar, die lokale Immunität einzuschätzen. Zur Bewertung von Maßnahmen und für die Verteilung von Ressourcen im Gesundheitswesen sind aber auch Informationen über die tatsächliche Zahl aktiver Infektionsfälle nötig. Hierbei könnten zum Beispiel vorhandene Ressourcen innerhalb des sozio-oekonomischen Panels (SOEP) als repräsentative Bevölkerungsstichprobe genutzt werden. Eine Kombination von Befragungen und medizinischer Testungen hätte zudem den Vorteil, dass gesundheitliche Verläufe ebenso wie kurz- und langfristige sozio-ökonomische Kosten der Krise gemessen werden könnten.

Zusätzlich sind Verbesserungen in der Datenerhebung und -vermittlung von Informationen zu diagnostischen Testungen wünschenswert. Mehr denn je ist daher auch eine Digitalisierung des Gesundheitssektors nötig, um mit den Informationen zum Infektionsgeschehen eine fundierte und transparente Grundlage für politische Entscheidungen zu schaffen. Eine Orientierung bietet beispielsweise Island: Dort werden die täglichen Testzahlen erhoben und der Öffentlichkeit zugänglich gemacht; zudem wird zumindest teilweise randomisiert getestet.[10]

Fußnoten

[1] In einem einfachen Entscheidungsmodell unter begrenzten Testkapazitäten wird zunächst eine Einschätzung über die Wahrscheinlichkeit eines Positivergebnisses bei Patienten getroffen. Im Anschluss wird auf Basis der Einschätzung die Testentscheidung gefällt. Vgl. Sendhil Mullainathan und Ziad Obermeyer (2019): A Machine Learning Approach to Low-Value Health Care: Wasted Tests, Missed Heart Attacks and Mis-Predictions (No. w26168). National Bureau of Economic Research (online verfügbar, abgerufen am 06.04.2020. Dies gilt für alle Onlinequellen in diesem Bericht, sofern nicht anders angegeben).

[2] Diagnostiken im Vorfeld einer Labortestung führen dazu, dass tatsächlich diejenigen Patienten getestet werden, für die eine Testung den größten Nutzen hat. In Deutschland gehört beispielsweise das Pflichtgespräch mit Ärzten zu diesen Diagnostiken. Vgl. Jason Abaluck et al. (2016): The determinants of productivity in medical testing: Intensity and allocation of care. American Economic Review 106.12 (2016): 3730-64.

[3] European Centre for Disease Prevention and Control: Download today’s data on the geographic distribution of COVID-19 cases worldwide (online verfügbar).

[4] Max Roser, Hannah Ritchie und Esteban Ortiz-Ospina (2020): Coronavirus Disease (COVID-19) – Statistics and Research (online verfügbar); Alexandra Hoffmann et al. (2020): Laborbasierte Surveillance SARS-CoV-2 (online verfügbar); Rijksinstituut voor Volksgezondheid en Milieu, Ministerie van Volksgezondheid, Welzijn en Sport: Virologische dagstaten (online verfügbar); Presidenza del Consiglio dei Ministri - Dipartimento della Protezione Civile: COVID-19 Italia - Monitoraggio situazione (online verfügbar); Agence nationale de santé publique (2020): COVID-19 : point épidémiologique du 5, 6, 7, 10, 15, 24 mars, 2 avril 2020 (online verfügbar); Korea Centers for Disease Control and Prevention: The updates on COVID-19 in Korea (online verfügbar); Sciensano, Epistat: Dataset of confirmed cases by date, age, sex and province (online verfügbar).

[5] Vgl. z.B. Elena Erdmann und Linda Fischer (2020): Warum das Virus in Italien tödlicher ist. Die Zeit vom 26. März (online verfügbar).

[6] Hoffmann et al. (2020), a.a.O.

[7] Vgl. z.B. Michael A. Ribers und Hannes Ullrich (2019): Künstliche Intelligenz und Daten können bei der Eindämmung von Antibiotikaresistenzen helfen. DIW Wochenbericht Nr. 19, S. 335–341 (online verfügbar).

[8] Mikrodaten ermöglichen auch Mittelwege ohne eine vollständige Randomisierung, vgl. Jon Kleinberg et al. (2018): Human decisions and machine predictions. The quarterly journal of economics, 133(1), 237–293

[9] Lothar H. Wieler in der Pressekonferenz zum Corona-Sachstand am 03.04.2020 (online verfügbar).

[10] Siehe Plattform Covid.is (online verfügbar); Jelena Ćirić (2020): Iceland’s Coronavirus Testing Could Help Global Pandemic Response. Iceland Review vom 2. April (online verfügbar).
Für die oben stehenden Pressemitteilungen, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Meldungstitel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Pressetexte sowie der angehängten Bild-, Ton- und Informationsmaterialien.
Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@lifepr.de.