Validierungsprojekt zum Zensus 2011

Inhalt und zentrale Ergebnisse des "Validierungsprojekts" zum Stichprobenforschungsprojekt beim Zensus 2011

Im Rahmen des sog. Stichprobenforschungsprojekts haben die Auftragnehmer Prof. Dr. Münnich (Universität Trier) / PD Dr. Gabler (GESIS Mannheim) u.a. Empfehlungen zur Hochrechnung von existenten und paarigen Personen aus der Haushaltebefragung auf Stichprobenbasis beim Zensus 2011 zwecks Ermittlung einer hinreichend präzisen Einwohnerzahl für die Gemeinden Deutschlands mit 10 000 oder mehr Einwohnern unterbreitet.

Die Empfehlungen waren das Ergebnis von Simulationsrechnungen, die mit einem auf Melderegisterdaten basierenden synthetischen Datenbestand durchgeführt wurden. Der synthetische Datenbestand enthielt keine unbemeldeten Anschriften ("Nullanschriften"), solche waren daher auch nicht Gegenstand des Forschungsprojektes. Im Zensus 2011 dagegen enthält der für die Haushaltestichprobe des Zensus relevante Anschriftenbestand, das Anschriften- und Gebäuderegister (AGR), auch unbemeldete Anschriften. Diese wurden bei der Stichprobenziehung bewusst mit berücksichtigt – um komplette Fehlbestandshaushalte aufzudecken und damit eine systematische Unterzeichnung der Einwohnerzahlen vermeiden zu können – und sind daher in der Stichprobe vertreten. Ferner mussten im Stichprobenforschungsprojekt Annahmen zu Umfang und Verteilung von Melderegister-Übererfassungen (Karteileichen) und Untererfassungen (Fehlbeständen), basierend auf Erkenntnissen des Zensustests, getroffen werden, während nun Echtdaten zur Verteilung der Registerfehler in den Gemeinden Deutschlands vorliegen.

Vor diesem Hintergrund wurde von Destatis an das Konsortium Münnich/Gabler ein Auftrag zur Feinjustierung des Hochrechnungsverfahrens für die Haushaltsstichprobe beim Zensus 2011 (kurz: "Validierungsprojekt") vergeben. Ziel war es zu untersuchen, inwieweit das Vorhandensein von Nullanschriften in der Stichprobe in Verbindung mit den realen Verteilungen von Karteileichen und Fehlbeständen eine Nachjustierung des im Forschungsprojekt empfohlenen Hochrechnungsverfahrens erforderlich macht.

Die Auftragnehmer haben sich dieser Fragestellung in Form von zwei unterschiedlichen Herangehensweisen angenommen: Zum einen wurden die Auswirkungen der Nullanschriften und der realen Verteilung der Registerfehler auf Basis der tatsächlich gezogenen Stichprobe untersucht. Zum anderen wurden Simulationsrechnungen durchgeführt, bei denen die Karteileichen- und Fehlbestandsstrukturen anhand von Modellen zunächst in die synthetische Grundgesamtheit hineinsimuliert wurden. Beide Wege führten im Grundsatz zu den gleichen Resultaten.

Bei den Untersuchungen wurden für unterschiedliche Szenarien Regressionsschätzungen (GREG) durchgeführt. Die Szenarien unterscheiden sich in der Art und Weise, wie die Regressionsparameter Beta geschätzt wurden, im Wesentlichen:

mit oder ohne Berücksichtigung von Ausreißern,

mit oder ohne Herausnahme von Nullanschriften,

nicht-gruppierte oder gruppierte Schätzung.

Im Ergebnis zeigte sich, dass nach wie vor die SMP-separate Schätzung ohne Ausreißerbereinigung und ohne Herausnahme von Nullanschriften die beste Wahl ist, da die niedrigsten Standardfehler resultieren. Ohne nennenswerten Einfluss hat sich die Einführung einer Dummy-Variablen zur Kenzeichnung einer Nullanschrift als zusätzliche erklärende Variable im Regressionsmodell heraus gestellt. Insofern bestand keinerlei Anlass, die Empfehlungen aus dem Stichprobenforschungsprojekt zum Hochrechnungsverfahren in irgendeiner Form zu modifizieren. Im Abschlussbericht wird als zentrales Ergebnis des Validierungsprojektes festgehalten : "Als geeigneter Schätzer für die Anwendung auf der realisierten Stichprobe wird weiterhin der SMP-SEP GREG-Schätzer ohne Ausreißerbehandlung und ohne gesonderte Behandlung der Nullanschriften empfohlen."

Im Rahmen des Validierungsprojetes haben die Auftragnehmer auch eine Schätzung der Stichprobenzufallsfehler für die Einwohnerzahlen der großen Gemeinden vorgenommen. Hierzu ist anzumerken, dass die in den Projektergebnissen enthaltenen Standardfehler aus folgenden Gründen noch nicht als das definitive Ergebnis der späteren Fehlerrechnung angesehen werden konnten: Erstens konnten dem Auftragnehmer für das Projekt noch keine Strukturdaten aus endgültig bereinigten Zensusdaten zur Verfügung gestellt werden, zweitens konnten im Projekt die Sonderanschriften und die beiden Nachziehungen nicht berücksichtigt werden, und drittens konnte Prof. Münnich im Regressionsmodell nur mit weniger Bezugsvariablen arbeiten als Destatis dies bei der späteren tatsächlichen Hochrechnung getan hat.

Ergänzend sind die Auftragnehmer der (theoretischen) Fragestellung nachgegangen, um wie viel präziser man die Einwohnerzahl hätte schätzen können, wenn man zum Zeitpunkt der Ziehung der Stichprobe unerwünschte von erwünschten unbemeldeten Anschriften hätte unterschieden können und nur die erwünschten in die Stichprobenziehung einbezogen hätte. Als erwünscht werden in diesen Simulationen diejenigen unbemeldeten Stichprobenanschriften angesehen, an denen bei der Erhebung tatsächlich Fehlbestände festgestellt wurden; deren Ausschluss hätte nämlich zu einer systematischen Unterschätzung der Einwohnerzahlen geführt. Die unbemeldeten Stichprobenanschriften, an denen dann auch tatsächlich keine existenten Personen festgestellt wurden, gelten in den Simulationen als die unerwünschten Anschriften.

Die Simulationen haben gezeigt, dass der relative Standardfehler im Schnitt lediglich um 1,25 % (Prozent, nicht Prozentpunkte!) niedriger gewesen wäre, wenn man unerwünschte unbemeldete Anschriften von vorneherein hätte ausschließen können.

Validierungsprojekt zum deutschen Zensus 2011 Abschlussbericht

Navigation und Service

Servicemenü

Springen zum Hauptmenu

Startseite

Zensus 2011

Unternavigationspunkte

Infothek

Unternavigationspunkte

Startseite

Validierungsprojekt zum Zensus 2011

Zusatzinformationen

Service