Rohdaten vs. gewichtete Daten
Key-Facts
- Rohdaten: Unbereinigte Antworten der Befragten
- Gewichtete Daten: Nach demografischen Merkmalen korrigierte Ergebnisse
- Typischer Unterschied: 1–3 Prozentpunkte pro Partei
- Veröffentlicht werden: Nur die gewichteten Daten
- Transparenz: Rohdaten werden von keinem Institut routinemäßig veröffentlicht
Was Medien als „aktuelle Umfragewerte" berichten, sind keine Rohdaten. Zwischen der Antwort eines Befragten und dem veröffentlichten Prozentwert liegt ein komplexer statistischer Prozess: die Gewichtung. Was genau passiert in diesem Schritt — und wie stark verändern sich die Ergebnisse?
Was sind Rohdaten?
Rohdaten (auch: ungewichtete Daten) sind die direkten Antworten der Befragten, bevor statistische Korrekturen angewendet werden. Wenn von 1.000 Befragten 280 angeben, CDU/CSU wählen zu wollen, ergeben die Rohdaten einen CDU/CSU-Anteil von 28%.
Das Problem: Die 1.000 Befragten sind in der Regel kein perfektes Abbild der Bevölkerung. Ältere sind überrepräsentiert, Jüngere unterrepräsentiert. Höher Gebildete nehmen häufiger teil als Geringqualifizierte. Die Rohdaten spiegeln daher die Meinung der Umfrageteilnehmer, nicht der Gesamtbevölkerung.
Was sind gewichtete Daten?
Bei der Gewichtung erhält jede Antwort einen Faktor, der die Verzerrung korrigiert. Sind 18–29-Jährige in der Stichprobe unterrepräsentiert, zählen ihre Antworten stärker. Sind Über-60-Jährige überrepräsentiert, zählen ihre Antworten weniger. Das Ergebnis: gewichtete Daten, die die Bevölkerung möglichst genau abbilden.
Beispiel: Rohdaten vs. Gewichtung
| Partei | Rohdaten (Beispiel) | Gewichtete Daten | Differenz |
|---|---|---|---|
| CDU/CSU | 28% | 30% | +2 PP |
| SPD | 17% | 16% | −1 PP |
| Grüne | 15% | 13% | −2 PP |
| AfD | 18% | 20% | +2 PP |
| BSW | 7% | 6% | −1 PP |
| FDP | 5% | 5% | 0 PP |
| Linke | 4% | 3% | −1 PP |
| Sonstige | 6% | 7% | +1 PP |
Hinweis: Die obigen Zahlen sind ein illustratives Beispiel, keine echten Umfragedaten. Sie zeigen die typische Größenordnung der Gewichtungseffekte.
Die Gewichtung kann Parteienwerte um 1 bis 3 Prozentpunkte verschieben. Bei der CDU/CSU und AfD führt sie typischerweise zu höheren Werten (weil deren Wähler in Umfragen unterrepräsentiert sind), bei den Grünen häufig zu niedrigeren (weil höher Gebildete überrepräsentiert sind).
Warum werden Rohdaten nicht veröffentlicht?
Kein deutsches Institut veröffentlicht routinemäßig seine Rohdaten. Die Gründe:
- Verzerrung: Rohdaten würden ein falsches Bild der Bevölkerungsmeinung zeigen.
- Missverständnisse: Laien könnten Rohdaten als „wahre" Ergebnisse interpretieren.
- Geschäftsgeheimnis: Aus den Rohdaten ließe sich das Gewichtungsmodell rekonstruieren.
Kritiker wie der Verein wahlrecht.de fordern mehr Transparenz — etwa die Veröffentlichung der ungewichteten Verteilungen als Kontext.
Was passiert, wenn Rohdaten doch durchsickern?
Es gibt vereinzelte Fälle, in denen Rohdaten öffentlich wurden — durch Datenpannen, versehentlich veröffentlichte Tabellenblätter oder investigative Recherchen. Das Ergebnis war in allen bekannten Fällen dasselbe: eine intensive Debatte darüber, ob die Gewichtung politisch motiviert sei.
Das illustriert ein grundlegendes Problem: Rohdaten ohne Erklärung sind gefährlicher als gar keine Daten. Wer sieht, dass die AfD in Rohdaten 24%, nach Gewichtung aber nur 20% hat, zieht schnell den Schluss, das Institut „drücke" den Wert nach unten — ohne zu verstehen, dass AfD-Wähler in Online-Panels systematisch überrepräsentiert sind und die Gewichtung diesen Bias korrigiert.
Das Allensbach-Modell: Mehr Transparenz als andere
Das Institut für Demoskopie Allensbach ist das einzige große deutsche Institut, das regelmäßig mehr methodische Details veröffentlicht als gesetzlich vorgeschrieben. Allensbach publiziert in der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) auch Angaben zur Stichprobenstruktur vor Gewichtung. Das ermöglicht Forschern, Gewichtungseffekte zumindest annäherungsweise nachzuvollziehen — etwas, das bei Forsa oder INSA nicht möglich ist.
Wie Forscher Rohdaten rekonstruieren
Weil Rohdaten nicht veröffentlicht werden, haben einige Wahlforschungsakademiker eine elegante Umgehungsstrategie entwickelt: implizite Rohdaten-Rekonstruktion. Die Logik: Wenn ein Institut seine Gewichtungsmatrix (z.B. „18–29-Jährige erhalten Faktor 1,3, Über-70-Jährige Faktor 0,7") veröffentlicht — was manche Institute in ihren Methodenberichten tun — lassen sich die Rohdaten rechnerisch zurückrechnen.
Diese Rückrechnung ist nie exakt, weil die Gewichtung meist mehrdimensional ist (Alter × Geschlecht × Bildung × Region). Aber sie ermöglicht es, ungefähre Rohdaten-Bereiche zu schätzen und damit die House Effects einzelner Institute zumindest teilweise zu erklären.
Für die Praxis bedeutet das: Wer die veröffentlichten Methodenberichte der Institute liest und die Gewichtungsfaktoren versteht, kann beurteilen, ob ein unerwarteter Wert — etwa ein plötzlich sehr hoher AfD-Wert bei INSA — durch die Rohdaten getrieben wurde oder durch eine Änderung im Gewichtungsmodell.
Gewichtung in der Praxis – warum falsche Justierung Ergebnisse verzerrt
Konkretbeispiel: In einer Stichprobe von 1.000 Befragten sind 45 % Männer und 55 % Frauen – die reale Bevölkerungsverteilung ist 50/50. Ohne Gewichtung wären Frauen überrepräsentiert. Ähnlich bei Bildung: Akademiker nehmen an Online-Umfragen deutlich häufiger teil (55 % Stichprobe vs. 32 % real). Bei der Bundestagswahl 2021 meldeten sich SPD-Sympathisanten nach der Wahl überproportional häufig für Nachwahlbefragungen – Institute, die keine Rückgewichtung auf tatsächliche Wahlergebnisse vornahmen, überschätzten den SPD-Anteil systematisch. Wer die Gewichtungsparameter eines Instituts kennt, kann beurteilen, ob unerwartete Werte datengetrieben oder modellbedingt sind.
Weiterführende Informationen: Bundeswahlleiter: Pressemitteilungen · Wikipedia: Meinungsumfrage
Häufige Fragen
Was sind Rohdaten bei Wahlumfragen?
Die unbereinigten Antworten der Befragten, bevor statistische Korrekturen (Gewichtung) angewendet werden. Sie spiegeln die Meinung der Stichprobe, nicht der Gesamtbevölkerung.
Warum werden Rohdaten nicht veröffentlicht?
Rohdaten sind verzerrt, weil bestimmte Gruppen in der Stichprobe über- oder unterrepräsentiert sind. Erst nach der Gewichtung bilden die Daten die Gesamtbevölkerung korrekt ab.
Wie stark verändert die Gewichtung die Ergebnisse?
Die Gewichtung kann einzelne Parteienwerte um 1 bis 3 Prozentpunkte verschieben. Bei großen Parteien ändert sich die Rangfolge selten, bei kleinen Parteien nahe der Fünf-Prozent-Hürde kann der Effekt entscheidend sein.
Weiterlesen
AfD gleichauf mit der Union
Was aktuelle Umfragen über die Parteienstärke sagen.
Gewichtung erklärt
Wie und warum Institute ihre Daten gewichten.
Transparenz bei Umfragen
Welche Informationen Institute offenlegen sollten.
House Effects
Systematische Abweichungen durch Gewichtung.
Alle Ratgeber
450+ Artikel zu Wahlen und Politik in Deutschland.
Bundestagswahl 2029
Nächste Bundestagswahl: Termin, Kandidaten und Koalitionsszenarien.