Entlarvt: Falsche Statistik bei den Wirksamkeitsstudien der Corona-Impfstoffe

In Kürze: Das Studiendesign mit zum Teil 40.000 Probanden vermittelt ein falsches Sicherheitsgefühl bei den Menschen. Es können – auch bei einer scheinbar sehr großen Anzahl an Probanden – in einem Zeitraum wie einem halben Jahr oder auch Jahr, keine validen Daten zur Wirksamkeit der Impfstoffe vorliegen.

Das Problem ist nämlich, dass wir Menschen aus ethischen Gründen nicht „von Hand“ bewusst anstecken dürfen.
Die Frage ist: woher weiß ich, wann die Probanden eine entsprechende Viruslast abbekommen haben?
Die Antwort: genau das weiß man nicht.

Fakt ist: genau hier ist sprichwörtlich „der Hund begraben“ – sogar das RKI gibt keinen Anhalt für die Wahrscheinlichkeit an, sich in Deutschland im Monat x als „Durchschnittsbürger“ anzustecken.

Auf unserer Website hier oder auf unserem Telegram Kanal hat man die Möglichkeit mit Kommentaren uns Rückmeldung zu geben bzw. mit uns auch in den Diskurs zu treten. Zu unserem Beitrag über eine simple Auswertung der Statistiken der britischen Gesundheitsbehörde erhielten wir zahlreiche solcher Kommentare – die uns zeigten, dass vielen Personen noch nicht die grundlegenden Mängel der aktuellen Studien bekannt sind. Da fanden wir Sätze wie:

Die Frage Wenn Sie ein Zufallsexperiment mehrmals ausführen und die Ausgänge notieren, dann erhalten Sie relative Häufigkeit eines Ereignisses. Zum Beispiel: Wie häufig werden Menschen mit und ohne Impfung krank.
Dabei kennen Sie die tatsächliche Wahrscheinlichkeit eines Ereignisses gar nicht, Sie versuchen aber durch die wiederholte Ausführung in die Nähe der tatsächlichen Wahrscheinlichkeit zu kommen.
Wenn Sie also in der Studie viele Menschen haben, wo geschaut wurde, welcher Anteil mit Impfung noch erkrankt und welcher ohne Impfung, dann sind diese relativen Häufigkeiten sehr sicher sehr nah an der tatsächlichen Wahrscheinlichkeit.

Genau dieser Aspekt – der oberflächlich betrachtet zu stimmen scheint – ist leider in dem speziellen Fall der Impfstudien nicht richtig. Zeit für das Corona Blog Team, Licht ins Dunkel zu bringen. Wir wollen in diesem Beitrag zwei elementare Mängel an der Darstellung der Studien und ihrer Systematik aufwerfen:

  1. Die Angabe der relativen Wirksamkeit verzerrt absichtlich die vorläufigen Resultate der Studie – und zwar extrem
  2. Das Studiendesign ist – bedingt durch einfache statistische Überlegungen – so ausgelegt, dass es über eine lange Zeit laufen muss, um valide Daten zu liefern

Fangen wir also an, auf diese beiden Punkte einzugehen.

1. Relative Wirksamkeit – oder extrem subjektive Zahlendarstellung

Wir haben es schon mehrfach erläutert und geschrieben: die relative Wirksamkeit ist ein Marketingtrick der Pharmaindustrie und stellt die Ergebnisse verfälscht dar. Das Thema ist allerdings so wichtig, dass wir es hier noch einmal erläutern wollen – und zwar am Beispiel der BioNTech-Pfizer Studie zur Wirksamkeit des mRNA Vakzins gegen die Südafrika Variante – wir erinnern uns, die wird mit „100% Wirksamkeit“ angegeben.
Um diese zu ermitteln wurde eine Studie durchgeführt, über die nur grobe Details bekannt sind: Es gab 800 Probanden in zwei Gruppen, am Ende hatten sich nach „bis zu einem halben Jahr nach der zweiten Dosis“ ganze 6 Personen in der ungeimpften Gruppe infiziert. Exaktere Angaben konnten wir nicht finden – dennoch reicht dies für eine Darstellung des Problems aus.
Stellen wir das Szenario in einem Bild dar:

Wir haben also 2 Gruppen zu (im Idealfall) je 400 Personen – die ebenfalls im Idealfall zufällig ausgewählt sind. Diese wurden (schon wieder im Idealfall) 6 Monate nach dem Piks (mit Impfstoff oder Placebo) beobachtet. 6 Personen in der Placebo Gruppe erkrankten – und zwar mindestens so schwer, dass sie Symptome hatten. Diese 6 Personen entsprechen 1,5% der ungeimpften Gruppe. In der geimpften Gruppe erkrankte keiner – d.h. 0%.
Daraus kann man schlussfolgern, dass das Risiko mit der Impfung zu erkranken in dieser Studie um absolut gesehen 1,5% geringer ist. Man spricht dann auch von Prozentpunkten.
Sprich: Die Impfung reduziert das Risiko einer Erkrankung in dieser 6 Monatsstudie um 1,5 Prozentpunkte.

Wie kommt nun BioNTech-Pfizer auf 100% Wirksamkeit? Ganz einfach, sie nutzen die – meist zu Marketingzwecken herangezogene – relative Wirksamkeit. Diese berechnet sich durch die Differenz der Wirksamkeiten und bezieht dann nochmal das Ergebnis auf die Wirksamkeit der ungeimpften Gruppe:

    begin{equation*} text{Relative Wirksamkeit }=frac{SI{1.5}{percent} - SI{0}{percent}}{SI{1.5}{percent}} cdot SI{100}{percent} = SI{100}{percent} end{equation*}

Durch diesen irreführenden Bezug (nochmal auf die absolute Wirksamkeit in der ungeimpften Gruppe) entsteht der falsche Eindruck, dass wirklich alle Menschen durch die Impfung vor der Erkrankung geschützt sind. Dies ist eine extrem verfälschte, hoch subjektive Art der Zahlendarstellung – extrem zu Gunsten der Pharmaindustrie.
Die absolute Wirksamkeit (1,5 Prozentpunkte geringeres Risiko) hat entscheidende Vorteile. Sie zeigt…

  • direkt, dass die beiden Gruppen sich in ihren Ansteckungsraten ähneln (sonst wäre der Abstand in Prozentpunkten größer)
  • dass der Vorteil der „geimpften Gruppe“ in dieser kurzen Studie lediglich 1,5 Prozentpunkte ist

Diese Darstellung ist also objektiver und stellt das Ganze nüchterner dar – eben an dem realen Sachverhalt orientiert. Dennoch findet man diese Zahl in den Studien von BioNTech-Pfizer nicht. Das überrascht eigentlich nicht wirklich – was dennoch überrascht ist, dass sogar die Öffentlich Rechtlichen diese offensichtlichen Werbezahlen der Pharmaindustrie unkritisch und ungefiltert weitergeben.

Dies zur Kritik an der reinen Form der Studien. Kommen wir nun zum „Eingemachten“ und zum zweiten Punkt: Kritik an den Aussagen zur Wirksamkeit aufgrund des Studiendesigns.

2. Das Studiendesign ist auf lange Dauer ausgelegt

Harte Theorie: Das Gesetz der großen Zahlen

Hier müssen wir einen kleinen Ausschweif über die Statistik machen – allerdings nur über die absoluten Grundlagen. Da gibt es das wichtige „Gesetz der großen Zahlen“, das im Grunde besagt, dass:

Die relative Häufigkeit eines Zufallsexperiments häuft sich bei häufiger Wiederholung um die theoretische Wahrscheinlichkeit eines Zufallsergebnisses an.

Klingt kompliziert – ist es aber nicht. Machen wir uns das Ganze an einem einfachen Beispiel klar: Nehmen wir an, wir wollen ins Casino gehen und dort fleißig um Geld würfeln – und zwar mit einem vierseitigen Würfel. Ja, so etwas gibt es:

Bei einem ungezinkten Würfel wie dem auf dem Bild, da wissen wir: jede Seite hat die gleiche Wahrscheinlichkeit zu erscheinen, nämlich bei dem 4-seitigen Würfel genau 25% (das wird im Gesetz „theoretische Wahrscheinlichkeit“ genannt).
Dies können wir überprüfen, wenn wir viele, viele Würfelversuche machen und uns notieren, welche Seite oben liegt. Bei vielen Versuchen sollte jede Seite genau 25% aller Würfelversuche oben liegen. Dies garantiert uns das Gesetz der großen Zahlen – bei einem ungezinkten Würfel.
Natürlich kann es sein, dass bei den ersten Versuchen „zufällig“ immer dieselbe Seite oben liegt – und wir einfach „Pech haben“. Aber: Das Gesetz der großen Zahlen garantiert uns, dass wenn wir viele, viele Würfelversuche machen, jede Seite zu 25% oben liegen wird.

Gehen wir langsam zu einem Experiment über

Nehmen wir an, wir wollen 2 unterschiedliche Casinos überprüfen und schauen, ob deren 4-seitige Würfel gezinkt sind.
Wie machen wir das? Wir gehen in Casino A, nehmen deren Würfel und machen unzählige Würfelversuche. Im Idealfall sollte jede Seite 25% aller Würfelversuche oben liegen. Wir machen danach dasselbe bei Casino B, wo wir dasselbe erwarten. Weicht unser Ergebnis nach unzähligen Versuchen davon ab, dann will ein Casino betrügen. Beispielsweise wenn in Casino A zu 40% eine Seite oben liegt, wissen wir, dass mit dem Würfel etwas nicht stimmt.
Warum?
Laut dem Gesetz der großen Zahlen sollten alle Seiten gegen die theoretische Wahrscheinlichkeit von 25% oben liegen – wenn der Würfel perfekt ist.

Was haben wir in den beiden Casinos gemacht? Ein Experiment. Dies besteht aus zwei Dingen:

  1. Einem Ereignis: Wir würfeln
  2. Einem Ergebnis: Die Seite die oben liegt

Durch ständiges Wiederholen des Ereignisses (wir würfeln oft), bestätigen wir im Ergebnis die Aussage des Gesetzes der großen Zahlen.

Ein erster Bogen zu den Impfstudien

Ähnlich wie beim Würfelexperiment läuft das Ganze auch in den Studien der Impfhersteller zur Wirksamkeit der Impfstoffe ab. Wir haben hier nur nicht 2 Casinos, in denen wir das Experiment durchführen, sondern 2 Personengruppen: geimpfte und ungeimpfte Personen.
Schaut man sich die Sache recht oberflächlich an, dann ist die Sache klar: Wir haben eine Studie mit 800 Teilnehmern (bei unserem Beispiel mit der Südafrika Variante) – das ist schon eine „große Zahl“. Manche Studien sind ja, mit über 40.000 Teilnehmern, noch größer angelegt.
Schauen wir nun nach, wer erkrankt und wer nicht, dann sollte das Ergebnis bei vielen Versuchen gegen die reale Wirksamkeit gehen, sprich: Die Studie aus dem ersten Abschnitt sollte passen. Wir haben also 1,5 Prozentpunkte Wirksamkeitsvorteil der geimpften Gruppe – oder eben populistisch ausgedrückt: 100% relative Wirksamkeit.
Aber: Haben wir das wirklich?

Der Haken liegt beim Ereignis – über ethische Probleme

Was auf den ersten Blick ganz logisch aussieht – ist es aber nur auf den ersten Blick.
Die entscheidende Frage ist nämlich: Was ist denn das Ereignis in unserem „Impfexperiment“? Ist das der Piks – also die Gabe von Impfstoff oder Placebo?
Nein. Das eigentlich Ereignis findet nämlich erst nach der Impfung oder nach der Placebo-Gabe statt. Erst wenn wir eine Gruppe durchgeimpft haben geht ja das „eigentliche Experiment“ los: wir wollen die Probanden natürlich dem Virus aussetzen – und zwar in einer ordentlichen Dosis – und schauen, ob sich die Geimpften anstecken oder ob die Impfung hilft.
Und hier liegt die Krux: Natürlich ist es ethisch und moralisch nicht vertretbar, die Probanden bewusst einer „hohen Viruslast“ auszusetzen bzw. zu infizieren. Auch wenn es natürlich für unser Experiment „optimal“ wäre.

Ein genauerer Blick auf Ereignis und Ergebnis – hier liegt der Hund begraben

Schauen wir uns nochmal grafisch an, wie unser optimales Experiment aussehen würde:

Wir haben also unser Ereignis (im Casino Beispiel der einfache Würfelwurf), also hier: das bewusste Aussetzen unserer Probanden mit einer hohen Viruslast – wo man weiß, sie würden sich normalerweise infizieren. Dazu haben wir vereinfacht hier vier mögliche Ergebnisse angenommen – in Anlehnung an den vierseitigen Würfel. Wenn wir das Ereignis in beiden Gruppen sehr, sehr oft „ausführen“ und die Wahrscheinlichkeiten deutlich voneinander abweichen – dann sehen wir (wahrscheinlich) einen Effekt der Impfung.

Das Problem ist immer noch das Ereignis: Da wir es aus ethischen Gründen nicht „von Hand“ auslösen dürfen, ist die Frage: woher weiß ich, wann die Probanden eine entsprechende Viruslast abbekommen haben? Sprich woher weiß man, dass das Experiment einmal ausgeführt wurde?
Die Antwort: genau das weiß man nicht.
Wir haben natürlich alle das alltägliche Risiko, diese Viruslast, die eine Erkrankung auslösen kann, abzubekommen. Aber das hängt von unzähligen Faktoren ab. Beispielsweise:

  • Der Prävalenz, also wie groß ist der Anteil, der aktuell in der Bevölkerung infiziert ist? Ist die Prävalenz hoch, ist die Wahrscheinlichkeit höher, dass ich mich beim Treffen mit einer anderen Person anstecke.
  • Dem persönlichen Verhalten: Wie oft treffe ich andere Personen? Bin ich ein verängstigter, älterer Mensch, der vom Dosenvorrat im Keller aus Angst vor den Bildern aus Bergamo lebt und gehe nicht mehr hinaus? Wie will ich dann jemals die für das Experiment nötige Viruslast abbekommen?
  • Wo arbeite ich bzw. wie sind die Arbeitsbedingungen.
  • Wie sind die politischen Rahmenbedingungen? Bei politisch erzwungener Ausgangssperre und geschlossenen Gaststätten ist das Risiko sich zu infizieren sicher auch geringer, als wenn man eine Nacht in der nächstgelegenen Kneipe mit zahlreichen Menschen verbringt.

Die Liste ließe sich endlos fortsetzen.
Fakt ist: genau hier ist sprichwörtlich „der Hund begraben“ – sogar das RKI gibt keinen Anhalt für die Wahrscheinlichkeit an, sich in Deutschland im Monat x als „Durchschnittsbürger“ anzustecken.

Eine grobe Abschätzung – als Anhalt

Für den Einzelhandel gibt es erste Ausarbeitungen um das Risiko hier pro Arbeitstag abschätzen zu können – aber auch dort ist ersichtlich, dass das Ergebnis von vielen Unbekannten abhängt.
Wir wollen – um ein Gefühl dafür zu bekommen – uns zumindest grob einen Anhalt verschaffen und nehmen dafür nur einen Schätzer für die Prävalenz, das heißt wie viele Personen in der Bevölkerung infiziert waren – bevor es den „Schutz“, die Impfung gab. Laut RKI Dashboard hatten im Zeitraum 01.03.2020 – 01.01.2021 (ca. Impfbeginn), d.h. über 306 Tage, ganze 1.765.063 Personen einen positiven PCR Test. Die Studie von BioNTech-Pfizer lief über ca. 6 Monate, d.h. 180 Tage. In dieser Zeit hatten in Deutschland geschätzt so viele Personen einen positiven PCR Test:

    begin{equation*} text{Anzahl positiver PCR Tests in 6 Monaten }=num{1765063} cdot frac{180}{num{306}} = num{1038272} end{equation*}

Bezogen auf die Einwohner (83,02 Millionen Menschen) hatten damit in dem halben Jahr 1,25% der Einwohner einen positiven PCR Test.

Schätzen wir die Anzahl der Experimente ab

Nehmen wir diesen groben Schätzer – 1,25% und beziehen ihn auf unsere eigentliches Experiment mit 800 Personen, bedeutet dies, dass lediglich

    begin{equation*} text{Anzahl der Ereignisse im Experiment }=num{800} cdot frac{SI{1.25}{percent}}{SI{100}{percent}} = num{10} end{equation*}

Experimente durchgeführt werden.

Was bedeutet dies jetzt? Nun – wie schon der Name unseres Gesetzes, das „Gesetz der großen Zahlen“, aussagt, dürfen wir nur aussagekräftige Ergebnisse erwarten, wenn wir eine große Anzahl an Experimenten durchführen, sprich wenn wir das Ereignis sehr, sehr oft durchführen.
Viele Menschen denken bei 800 oder 40.000 Probanden an eine Ereignisanzahl in dieser Größenordnung – das ist falsch, wie wir hier gezeigt haben. In der Realität wird nur ein marginaler Bruchteil davon wirklich an dem „Ereignis“ (viel Viruslast abbekommen) teilnehmen. Es ist anzunehmen, dass die 1,25% hier aus dem groben Überschlag noch deutlich zu hoch angesetzt ist (da bei den PCR Tests auch unzählige asymptomatische Personen und falsch-Positive erfasst wurden).

Wie kann man das Problem nun lösen?

Das Problem kann ganz einfach gelöst werden: Indem das Experiment lange – sehr lange, über mehrere Jahre läuft. Warum? Es ist vermutlich einleuchtend, dass wenn das Experiment nur lange genug läuft, irgendwann der Großteil der Teilnehmer irgendwann einmal sein „Ereignis“ haben wird – sprich er wird eine hohe Dosis an Viruslast abbekommen.
Nicht umsonst laufen die Phase 3 Studien offiziell mit Masse bis 2023. Und nicht umsonst dauerten bislang Zulassungsverfahren von Impfstoffen eben Jahre.
Was jedoch auf jeden Fall in dem Artikel vermittelt werden sollen: Alleine durch das Studiendesign können – auch bei einer scheinbar sehr großen Anzahl an Probanden – in einem Zeitraum wie einem halben Jahr oder auch Jahr, keine validen Daten zur Wirksamkeit der Impfstoffe vorliegen.
Die bisherigen Rechnungen kann man nicht für valide Aussagen zur Wirksamkeit heranziehen – aufgrund einer deutlich zu kleinen Zahl an „Experimenten“. Dass die Pharmaindustrie und unsere Medien trotz diesem „Designfehler“ darüber hinaus noch die relative Wirksamkeit verkünden, spricht für sich.


Abonniert uns gerne auf Telegram – Corona ist nicht das Problem

Und auch bedenken: Es gibt hier keine Placebo-Gruppe, denn die „Impfung“ verursacht fast immer starke Impfreaktionen. Es ist den Probanden also bekannt, ob sie geimpft sind oder nicht… und wer geimpft wurde fühlt sich vielleicht sicher und geht nicht zum Arzt mit „leichten Symptomen“.

Dass hab sogar ich verstanden

Author: James Fond