Bad Practice

Wie der Tagesspiegel fahrlässig Fehlinformationen zu Corona verbreitet


[Update 26.10.20 – 08:00 Uhr: Dieser Beitrag wurde angesichts der nunmehr dritten Änderung, die der Tagesspiegel an seinem Artikel vornahm, ergänzt].

In Zeiten der Covid19-Pandemie, in der Daten – deren Analyse und Visualisierung – auch in der breiten Öffentlichkeit eine wohl kaum dagewesene Rolle spielen, kommt Datenjournalist*innen eine wichtige Rolle zu: Zugang zu Daten zu beschaffen, Ordnung in die Datenmengen zu bringen und diese auf Relevanz und Aussagekraft abzuklopfen, sind ureigene Aufgaben des Metiers.

Deswegen ist die Betrachtung von Beispielen, die nicht gelungen sind, hilfreich. Um andere dafür zu sensibilisieren, dass bei einem Themengebiet wie Corona, bei dem einiges an Verunsicherung herrscht, noch mehr Sorgfalt als sonst an den Tag gelegt werden sollte. Daten-Fehlinterpretationen können sich schnell als vermeintliche Gewissheiten verbreiten. Was kontraproduktiv ist.

Der Tagesspiegel meinte am Freitag, den 23.10.20, er sei dazu in der Lage, die Frage zu beantworten, die sonst niemand beantworten kann: „Wo sich die Menschen mit Corona infizieren“ [Die Überschrift lautet jetzt „Wo infizieren sich Menschen mit Corona?“.]“ Die Antwort darauf sei: „Die Menschen stecken sich vor allem zu Hause an.“ Quasi als Kronzeuge für diese Behauptung diente ein Diagramm des Robert Koch-Instituts (RKI), das in dessen Lagebericht (pdf) vom 20.10.2020 auf Seite 12 veröffentlicht wurde.

RKI, Lagebericht, 20.10.20, S. 12

Was dem Tagesspiegel entgangen war, ist, dass die Grafik nur ca. 16 Prozent des Ausbruchsgeschehen aller dem RKI gemeldeten Infektionen darstellt. Das stand zum einem im Textteil unterhalb des Diagramms selbst. Dass es sich nur um einen kleinen Teil aller gemeldeten Infektionen handeln konnte, machte zudem die Beschriftung der y-Achse deutlich (vierstellige Ziffern vs. Kalenderwochen).

So etwas kommt vor. Ich machte den Tagesspiegel über einige Kanäle auf den Fehler aufmerksam. Und nach einiger Zeit wurde reagiert und eine Korrektur angekündigt. Damit hätte die Sache sich gehabt. Doch die Korrektur war nur kosmetischer Natur. Die falsche, unbelegbare Grundaussage des Textes blieb bestehen (abgesehen davon, dass der Tagesspiegel entgegen seiner eigenen Redaktionsrichtlinien die Korrektur nicht kenntlich machte).

[Ergänzung 26.10.20] Am späten Samstagnachmittag (24.10.20), etwa 24 Stunden nach der ersten Korrektur – wohl auch auf Reaktion auf diesen Text hier – wurde dann unter dem Artikel auf Änderungen hingewiesen und der Artikel zum 2. Mal geändert. Der Hinweis war recht knapp und nach dann in einer weiteren 3. Korrektur ausführlicher. So heißt es nun im Artikel selbst:

Einige kritisieren diese Art der Auswertung, weil aufgrund der hohen Dunkelziffer offen ist, ob solche Auswertungen tatsächlich eine hohe Aussagekraft haben. Andererseits sind solche Erhebungen derzeit eben die einzigen strukturierten Erhebungen zu Ausbruchsorten: So lange nicht über zufällige Stichproben in der Bevölkerung anlasslose Tests stattfinden, ist es schwer, bessere Auswertungen durchzuführen.

Hier tritt der Grund für den Trugschluss seitens des Tagesspiegel erneut zu Tage (s.u.): Die Daten des RKI und auch der Gesundheitsämter sind keine „strukturierten“ Erhebungen. So heißt es zu den Daten des RKI in einem aktuellen Beitrag (23.10.20) des NDR: „Ihr Zweck ist nicht, eine repräsentative Aussage zu treffen, sondern als Alarmanlage zu fungieren“. Weiter schreibt der NDR: „Ein Forscher bezeichnet die Frage nach der Höhe der Dunkelziffer sogar als ‚Million-Dollar-Question‘.“

Warum der Tagesspiegel an seiner Aussage im Vorspann „Oft passieren Ausbrüche im Privaten“ weiter festhält, obwohl er mittlerweile selbst in seinem Korrekturhinweis am Ende seines Artikels auf die Problematik der Dunkelziffer eingeht, ist mir weiterhin unverständlich. [Ergänzung Ende]

Was nicht passt, wird passend gemacht

Die Neufassung des Tagesspiegel-Textes drehte sprachlich ein wenig runter. Etwa wurde aus der Kopfzeile „Die Gefahr lauert zu Hause“ nun „Die Gefahr lauert auch im Privaten“.

Die Grundthese, im Privaten fänden die meisten Infektionen statt, wird weiter behauptet. Neu ist, dass nun RKI-Präsident Lothar Wieler im Text zitiert wird. Demnach soll er am Donnerstag (22.10.20) mit Verweis auf das Diagramm aus seinem Haus gesagt haben: „Ein Großteil der Menschen steckt sich im privaten Umfeld an.“ Allein, dass der RKI-Präsident die Grafik seinen eigenes Hauses missversteht, sollte dem RKI zu denken geben (es hätte sowohl im Text als auch in der Grafik des Lageberichs durchaus deutlicher werden können, dass es sich nur um einen kleinen Anteil aller gemeldeten Fälle handelt).

Die Aussage zum „privaten Umfeld“ lässt sich so nicht treffen. Es ist nämlich völlig unklar, ob die in besagtem Diagramm aufgeschlüsselten 16 Prozent des Ausbruchsgeschehens als repräsentativ gelten können. Darüber hinaus – und das ist der Grund für den eigentliche Trugschluss des gesamten Tagesspiegel-Artikels – gibt es eine Dunkelziffer beim Infektionsgeschehen (siehe Grafik ganz oben). Deswegen können auch die anderen Beispiele, die der Tagesspiegel z.T. nachträglich anführt, nur spekulativer Natur sein („Dass viele der aktuell Neuinfizierten sich tatsächlich in ihren eigenen Haushalten infizieren, bestätigen Daten einiger Bundesländer auf Anfrage“ [Der Satz wurde vom Tagesspiegel mittlerweise gestrichen]). Denn die Anzahl der tatsächlichen Infektionen (also inkl. der Dunkelziffer) ist schlicht nicht bekannt und es gibt dazu bislang keine gesicherte Erkenntnis.

Der Medizinstatistiker Gerd Antes sagte unlängst in einem Interview mit dem SWR (20.10.20) hinsichtlich der Dunkelziffer: „Über allem schwebt aber der große, dunkle Schatten, dass die Zahlen nicht richtig sind, weil wir keine systematisch erfassten Zahlen haben.“

Zur Nachverfolgung des Ausbruchgeschehens gab Antes zu bedenken: „Wenn Sie im privaten Kreis jemanden erwischen mit einem positiven Test, dann haben Sie es wesentlich einfacher, die Beteiligten zu ermitteln. Viel einfacher als in einer Bar, wo auch noch die Hälfte der Angaben falsch sind. Die Atmosphäre ist auch viel freundlicher. In einer Familie haben sie oft eine enorme Bereitschaft, die Daten zu liefern und alles mitzumachen, was empfohlen wird. Das geht ganz schnell und die landen dann vollständig in der Statistik des Landesgesundheitsamtes, während die anderen zum großen Teil einfach weg sind.“

Die von Antes beschriebene Verzerrung in der Datenerhebung könnte Ausdruck des „Überlebensirrtum/ Survivorship Bias“ (Wikipedia) sein: Der bevorzugt erfolgreiche und/oder einfach zugängliche Vorgänge.

Was hätte der Tagesspiegel besser machen können?

– Plausibilätsprüfung: Warum hat noch niemand anderes den vermeintlichen „Scoop“ erkannt, wenn das Indiz dafür doch für alle zugänglich und offensichtlich ist?

– Fachmenschen um Einschätzung bitten

– Quellen genau benennen und verlinken

Vor allem hätte der Tagesspiegel meiner Meinung nach den Text zurückziehen müssen, der nunmehr seit 24 Stunden als einer der „meistdiskutierten“ Beiträge auf seiner Website steht. Er verbreitet weiterhin fahrlässig Fehlinformationen, obwohl die Redaktion auf offensichtliche Mängel hingewiesen wurde, die sie auch zur Kenntnis genommen hat.

Es ist derzeit nicht hilfreich, Leuten zu vermitteln, die größte Ansteckungsgefahr ginge von privaten Haushalten aus. Eine Aussage wie „diese Orte spiegeln sich absolut nicht in den politischen Maßnahmen wider“ ist schlicht eine Behauptungen und journalistisch nicht haltbar. [Der Tagesspiegel hat diesen Satz nun geändert und schreibt: „… spiegeln sich auch nicht in den politischen Maßnahmen wider.“] 


Anmerkung (26.10.20 – 08:00 Uhr): Dieser Text wurde um den Hinweis auf den „Survivorship-Bias“ (Danke @fil_ter) ergänzt. Weiter wurde das Zitat aus dem Artikel nach der 3. Korrektur des Tagesspiegels und der Absatz davor sowie die beiden darauf folgenden eingefügt. An drei Stellen wurde auf Änderungen im Tagesspiegel-Text hingewiesen.

5 Gedanken zu „Bad Practice“

  1. Danke für diese Aufklärung. Viele Aussagen decken sich mit Gedankengängen, über die ich die letzten Tage auch gegrübelt habe. Ich kam auch zu dem Schluss, dass es an diversen Stellen zu Verzerrungen kommen muss. Letztlich glaube ich z. B. auch, dass der Mehrheit der Menschen auch bewusst ist, dass man Kontakte beschränken sollte. Deshalb hält man sich automatisch auch länger im „privaten Raum“ auf. Andererseits glaube ich auch, dass man selbst natürlich nicht gerne (bewusst) erkennen will, dass man sich vielleicht im „öffentlichen Raum“ angesteckt haben könnte (weil der Aufenthalt aktuell einer gewissen „Ächtung“ unterliegt). Deshalb glaube ich auch, dass die 16 % keinesfalls repräsentativ sind. Auch da glaube ich, dass Menschen deshalb Fehler unterlaufen, weil man im Kopf hat, dass man mit knapp über 1000 Personen die Bundestagswahl relativ gut hochrechnen kann. Intuitiv könnte man dann zum Schluss kommen, dass 16 % einer Grundgesamtheit „automatisch“ repräsentativ sind.

  2. Hat einer mal die Power und p-value und confidence intervals ausgerechnet? Ein Viertel der Fälle ist erfasst (wie genau wüsste ich allerdings auch mal gerne), das ist ja gar nicht mal so schlecht, den nicht sonderlich geglückten Tagesspiegelartikel mal außen vor. Der Bias wird hoch sein, wie hoch ist natürlich auch eine Frage – aber so völlig abtun (das klingt in dem Artikel hier, als müsste man das komplett in die Tonne kloppen) würde ich die Daten ohne weitere Analyse auch nicht.

Schreibe einen Kommentar zu Lorenz Matzat Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert