Verkehr

Im Erbsenbeet wird nachgesät – Über richtige und falsche Veränderungsraten in den Personenverkehrsstatistiken

Lesedauer: 16 Minuten

Das Erstellen von Statistiken wird gern als „Erbsen zählen“ abgetan. Doch es steckt ein gehöriges Know-how darin. Schon die Auswahl der Untersuchungseinheiten spielt eine sehr wichtige Rolle. Sie entscheidet maßgeblich über die Aussagekraft der Ergebnisse zum betrachteten Zeitraum und über die Vergleichbarkeit über die Zeit. Für eine gute Vergleichbarkeit reicht das bloße Zählen der Erbsen nicht, wenn Lücken im Erbsenbeet entstehen und durch Nachsaat aufgefüllt werden. Hier muss der Statistiker manchmal die bestehenden Zahlen um geeignete Berechnungen zur Entwicklung ergänzen, wie der Autor im Folgenden anhand der Personenverkehrsstatistiken zeigt.

Von Jacek Walsdorfer, Hessisches Statistisches Landesamt

Einleitung

„Durch die Ergebnisse der Bundesstatistik werden gesellschaftliche, wirtschaftliche und ökologische Zusammenhänge für Bund, Länder einschließlich Gemeinden und Gemeindeverbände, Gesellschaft, Wirtschaft, Wissenschaft und Forschung aufgeschlüsselt“, erklärt § 1 Satz 4 BStatG1. Im Bereich der Wirtschaftsstatistiken liegt der Schwerpunkt einerseits in der Erfassung des gesamten Ausmaßes einer Erscheinung – wofür landläufig der Begriff „Mengenstatistik“ verwendet wird. Vielfach zielt das Design der amtlichen Datenerhebung darauf, aus den „großen“ Beiträgen zur Gesamtsumme das Gesamtgeschehen abzubilden. Die übrigen Betriebe oder Unternehmen, die nur einen sehr geringen Anteil zur Gesamtsumme beisteuern, werden entlastet. Andererseits sollen die aufzuschlüsselnden Zusammenhänge mittels einer Strukturstatistik nach einzelnen Teilbeiträgen gegliedert und die Bedeutung der vorhandenen Teilgruppen aufgezeigt werden. Dies lässt sich normalerweise mit einer Stichprobenauswahl besser umsetzen. Darüber hinaus soll die amtliche Statistik neben der aggregierten Gesamtentwicklung auch Strukturveränderungen wiedergeben sowie diese rekursiv in ihren Methoden berücksichtigen.

Einen Versuch, den verschiedenen Anforderungen gerecht zu werden, stellt der Artikel am Beispiel der Personenverkehrsstatistiken vor. Drei Erhebungen erfassen in vierteljährlichem, jährlichem respektive fünfjährlichem Turnus die Beförderungsleistung und strukturellen Gegebenheiten im öffentlichen Personennahverkehr (ÖPNV). Die meldepflichtigen Unternehmen werden jeweils für vergleichsweise lange Zeiträume bestimmt. Ohne besondere Berücksichtigung der Entwicklungen einzelner Untersuchungseinheiten bzw. Gruppen von ihnen resultiert daraus eine Verzerrung der Ergebnisse. Das gilt vor allem für die vierteljährliche Personenverkehrsstatistik. Die Schwierigkeiten entstehen insbesondere nach dem „Wiederauffüllen“ des Berichtskreises und werden durch den kleinen Umfang des Berichtskreises noch verstärkt.

Im nächsten Abschnitt wird die Problematik ausführlich dargestellt und anhand einiger Beispiele veranschaulicht. Anschließend werden Ansätze diskutiert, wie die Statistischen Ämter des Bundes und der Länder die Unzulänglichkeiten der Ergebnisse beheben können. Ein Fazit fasst die gewonnenen Erkenntnisse zusammen. Abschließend betrachtet ein Ausblick mögliche künftige Entwicklungen sowohl seitens der Statistik als auch seitens der Merkmalsträger.

Hintergründe der Ergebnisverzerrung

Im Sektor des öffentlichen Personennahverkehrs (ÖPNV) ist die Anzahl der Akteure auf der Angebotsseite (Verkehrsunternehmen) übersichtlich und auf der Nachfrageseite (Fahrgäste) groß. Das Angebot besteht aus Transportdienstleistungen, die mit Eisenbahnen, Straßenbahnen und Omnibussen erbracht werden.2 Hier betätigen sich neben einigen „Platzhirschen“ auch Nischenanbieter. Die Leistungserbringung ist überdies an Konzessionen gebunden, die in regelmäßigen Abständen für einzelne Verkehrsangebote, z. B. Linienverbindungen, ausgeschrieben werden. Veränderungen auf der Angebotsseite dürfen die Personenverkehrsstatistiken nur mit zum Teil deutlicher Verzögerung nachvollziehen (siehe Infokasten 1).

Infokasten 1: Personenverkehrsstatistik
Die Statistik der Personenbeförderung erfasst Mengenmerkmale zum Nahverkehr und zum Omnibusfernverkehr. Sie gibt Auskunft über den Angebotsumfang sowie seine Entwicklung und den Saisonverlauf. Darüber hinaus liefert sie Strukturinformationen über die beteiligten Unternehmen und die Art der Leistungserbringung.

Die Statistik der Personenbeförderung umfasst gemäß § 17 VerkStatG 3 drei Erhebungen:
– Die vierteljährliche Erhebung mit Angaben zu Fahrgästen und Beförderungsleistungen im Schienennahverkehr sowie im Liniennah- und Linienfernverkehr mit Omnibussen, jeweils für das gesamte Unternehmen,
– die jährliche Erhebung mit Angaben über den Unternehmenssitz und die Eigentumsverhältnisse am Unternehmen sowie über regional differenzierte Verkehrs- und Betriebsleistungen der Unternehmen und
– die fünfjährliche Erhebung, mit gleichem Merkmalskatalog wie die jährliche Erhebung und zusätzlich mit Angaben über stichtagsbezogene Strukturdaten der Unternehmen.

Die Angaben stammen von Unternehmen, die Personennahverkehr mit Eisenbahnen oder Straßenbahnen (einschl. Hoch-, U-, Stadt-, Schwebebahnen und ähnliche Bahnen, aber ohne Berg- und Seilbahnen) oder Personennah- oder Personenfernverkehr mit Omnibussen (Kraftomnibusse und Obusse) betreiben, auch wenn dies nicht ihre Haupttätigkeit darstellt. Nicht berücksichtigt wird der Verkehr mit Taxen oder mit Mietwagen. Einbezogen sind auch ausländische Unternehmen, die Linienverkehre im Inland betreiben.

In der vierteljährlichen Erhebung werden Unternehmen mit mindestens 250 000 Fahrgästen im Jahr befragt. Die Jahreserhebung erstreckt sich auf die großen Unternehmen als Totalschicht sowie auf eine repräsentative Auswahl an kleineren Unternehmen; bei den Letztgenannten zusätzlich mit einem gekürzten Fragenprogramm. Alle fünf Jahre wird die Jahreserhebung als Totalerhebung bei allen Unternehmen durchgeführt. Daraus ergibt sich ein vollständiger Überblick über den Bereich. Die Ergebnisse der Totalerhebung sind gemäß § 16 Abs. 1 Satz 2 VerkStatG die Auswahlgrundlage für die jährliche und die vierteljährliche Erhebung.

Die Praxis zeigt, dass in den Ausschreibungsverfahren durchaus wechselnde Anbieter zum Zuge kommen. Aus diesem Umstand und aus betriebswirtschaftlichen Entscheidungen ergeben sich immer wieder Strukturveränderungen. So stellte ein hessisches Unternehmen seinen Linienverkehr in Hessen im Juni 2018 ein, nachdem im Vergabeverfahren ein rheinland-pfälzisches Unternehmen zum Zug gekommen war.4 Da die vierteljährliche Personenverkehrsstatistik Unternehmensergebnisse ohne regionale Unterteilung erfasst, wird sie dieses Verkehrsangebot künftig in Rheinland-Pfalz ausweisen anstatt in Hessen. Umgekehrt erhielt die hessische Statistik einen Zuwachs, als der DB-Konzern ab 2011 einen vormals kleinen Omnibusbetrieb zur Regionalmarke ausbaute.5 Das Fahrgastaufkommen mehrerer Linienbündel ging innerhalb des Konzerns von einer bayerischen auf die hessische Tochtergesellschaft über. Die davon ausgehenden Veränderungen mussten sich nicht nur im Verkehrsgeschehen, sondern auch in der Statistik erst einmal einpendeln.

Alle 5 Jahre wird der gewerbliche Personennahverkehr und der Omnibusfernverkehr einer Totalerhebung unterzogen. Nur bei dieser „Generalinventur“ stellen die statistischen Ämter fest, welchen Beitrag die verschiedenen Anbieter zur Mobilität leisten. In den Zwischenjahren und bei der konjunkturellen Erhebung der Personenverkehrsleistungen ist die Befragung und damit die Belastung weitestgehend auf die „Großen“ der Branche beschränkt, die bei der letzten Totalerhebung identifiziert wurden.

Die amtliche Statistik in Deutschland konzentriert ihre Unternehmensstatistiken in der überwiegenden Mehrheit auf die Merkmalsträger mit dem (mutmaßlich) größten Beitrag. I. d. R. wird auf diese Weise ein hoher Abdeckungsgrad bei den Erhebungsmerkmalen erreicht. Gerade bei einer relativ kleinen Grundgesamtheit, wie sie der Personenverkehrsstatistik zugrunde liegt, ist diese Form der Aufwandsbeschränkung gegenüber einer Stichprobenbefragung vorzuziehen.6 Hinzu kommt eine starke Konzentration der Einzelbeiträge auf die „größten“ Untersuchungseinheiten. Aufgrund dessen wird das Auswahlproblem, das bei einer Stichprobe zu berücksichtigen wäre, unbedeutend (zumindest bei Betrachtung auf aggregierter Ebene)7. Zudem können „große“ Unternehmen die Belastung durch statistische und andere Meldepflichten leichter tragen.8 In methodischer Hinsicht wird außerdem die Unsicherheit, mit der Stichprobenergebnisse zwangsläufig behaftet sind, gemindert.9 Allerdings sind die Ergebnisse zugunsten der „Großen“ verzerrt10, woraus sich Beschränkungen für Strukturanalysen ergeben.

Durch die wiederholte Befragung derselben Untersuchungseinheiten zu verschiedenen Zeiträumen ergibt sich faktisch eine Panelbefragung. Gegenüber Daten aus Stichproben- oder Querschnitterhebungen mit wechselnder Zusammensetzung weisen Paneldaten „verschiedene Vorteile auf. So lassen sich individuelle Veränderungen der interessierenden Eigenschaften über die Zeit nachvollziehen und ermöglichen dadurch die Prüfung von kausalen Zusammenhängen. Daneben erlauben Paneldaten zudem eine effizientere Schätzung von Veränderungen der Populationsmerkmale über die Zeit als Trenddaten, da bei Panelerhebungen die Stichproben zu den verschiedenen Erhebungszeitpunkten nicht unabhängig sind.

[…] Da bei vielen Vollerhebungen der amtlichen Statistik Auskunftspflicht herrscht, kommen keine ‚Panelausfälle‘ im eigentlichen Sinn vor; sind Einheiten der letzten Vollerhebung nicht mehr in der nächsten Vollerhebung enthalten, ist selbst dieser Ausfall informativ (‚Ausfälle‘ kommen dann beispielsweise durch Betriebsauflösungen zustande).“11 Diese Ausfälle dokumentiert die vierteljährliche Personenverkehrsstatistik zuverlässig.

Während die Abgänge fortlaufend aus der vierteljährlichen „Konjunkturstatistik des Personenverkehrs“ ausscheiden, werden die Zugänge nur alle 5 Jahre in vollem Umfang berücksichtigt. Innerhalb dieser Zeitspanne ereignen sich selbst in einer überschaubaren Grundgesamtheit alle Vorgangsarten, die die Unternehmensdemografie zu bieten hat (siehe Infokasten 2).

Infokasten 2: Unternehmensdemografie
Die Neubildung von Unternehmen, ihr Wachstum und ihre Schließung werden unter dem Begriff „Unternehmensdemografie“ zusammengefasst. Neben Neugründungen und Geschäftsaufgaben wirken sich Fusionen, Übernahmen, Ab- und Aufspaltungen sowie Kooperationen unterschiedlicher Art auf die Akteurspopulation aus (siehe Abbildung 1).12 Hinzu kommen Entscheidungen der Unternehmen über die zu besetzenden Geschäftsfelder. Diese Vorgänge muss die amtliche Statistik im Rahmen der Datenerfassung und -auswertung angemessen berücksichtigen. Besonders solche Statistiken, bei denen „im Raum verteilte“ Daten (z. B. beförderte Fahrgäste oder verwendete Treibhausgase) einzig dem Unternehmenssitz zugeordnet werden, sind davon betroffen. Vor diesem Hintergrund sind aus Sicht der Landesstatistik besonders Verlagerungen über die Landesgrenze und Zusammenschlüsse mit landesfremden Einheiten schwierig wiederzugeben. Außerdem ist im Fall des Zusammenschlusses von bisher selbstständigen Unternehmen die Plausibilitätsprüfung der von der neuen Einheit erhobenen Daten sehr aufwändig.

Echte Neugründungen und Schließungen spielen in ihrer Mehrzahl für die statistische Betrachtung des Marktgeschehens eine untergeordnete Rolle. Neue und junge Unternehmen wachsen i. d. R. erst in den Markt hinein, während der Geschäftsaufgabe vielfach ein Schrumpfungsprozess vorausgeht. Dennoch leisten sie ebenso wie betriebswirtschaftliche Entscheidungen in fortgeführten Unternehmen, die sich in den übrigen der oben genannten Vorgänge äußern können, ihren Beitrag zum strukturellen Wandel.

Abbildung 1: Beispielhafte Vorgänge der Unternehmensdemografie

Darin besteht ein maßgeblicher Unterschied zu den Konjunkturstatistiken im Produzierenden Gewerbe, die größtenteils ebenfalls als Vollerhebung mit Abschneidegrenze konzipiert sind, deren Berichtskreise jedoch anhand von Strukturdaten aus dem Unternehmensregister jährlich neu bestimmt werden. Im Endeffekt ergibt sich auch hier eine weitgehende Kontinuität der Merkmalsträger. Im Unterschied zu ihnen wird die Abschneidegrenze bei den Personenverkehrsstatistiken jedoch nicht auf aktuelle Registerdaten angewandt. Vielmehr richtet sie sich auf eines der Erhebungsmerkmale, das für alle Einheiten, die zur Grundgesamtheit gehören, nur im Rahmen der Totalerhebung erfragt wird.13

Abbildung 2: Zur vierteljährlichen Personenverkehrsstatistik auskunftspflichtige hessische Unternehmen von 2001 bis 2016

Abbildung 2 verdeutlicht das Schrumpfen der Erhebungspopulation der Personenverkehrsstatistik im Lauf des fünfjährlichen Rhythmus’. Selbst die gesetzliche Teilnahmeverpflichtung kann diese „Panelmortalität“ nur begrenzt eindämmen. Der Effekt betrifft in erster Linie Unternehmen, die Linienverkehr mit Omnibussen betreiben. Strukturelle Veränderungen in diesem Segment werden nur im Zuge der planmäßigen Neubildung des Berichtskreises vollumfänglich berücksichtigt. Entsprechend geht in Abbildung 3 die oben erwähnte Umstrukturierung, die der Deutsche-Bahn-Konzern bezüglich seines ÖPNV-Angebots mit Omnibussen in Hessen vornahm, im 1. Quartal 2011 als Zuwachs ein: Da Leistungen, die zuvor von einer in Bayern ansässigen Konzerntochter erbracht worden waren, von einer hessischen Dependance übernommen wurden, stiegen die Fahrgastzahlen des Omnibusnahverkehrs in Hessen überdurchschnittlich an.

Abbildung 3: Fahrgäste im hessischen Liniennahverkehr von 2004 bis 2016 (indexiert: Durchschnitt 2004 = 100)

Das Verkehrsmittel Omnibus trägt nur einen Teil des gesamten Linienverkehrs. Im Sinne einer besseren Übersicht zeigt die Grafik indexierte Werte mit dem Jahresdurchschnitt 2004 als Basis (= 100).

Interpretationen der Veränderungsraten

Jeweils an den Bruchstellen, wenn der Berichtskreis nach der Totalerhebung neu gebildet wird, ist die Interpretation der Veränderungen zum Vorjahreszeitraum schwierig. Das „Erhebungspanel“ erfährt einen gravierenden Einschnitt. Legt man allein die aggregierten Querschnittsergebnisse der Fahrgastzahlen zugrunde, ergibt sich für den Liniennahverkehr im 4. Quartal 2016 gegenüber dem Vorjahresquartal eine Steigerung um 1,6 %, im Teilbereich mit Omnibussen um 1,1 % (siehe Tabelle 1). Allerdings meldeten nur 67 Unternehmen zu beiden Zeiträumen. 7 Unternehmen wurden 2015 einbezogen, aber nicht mehr 2016. Sie beförderten im 4. Quartal 2015 weniger als 0,2 % der Fahrgäste im gesamten Linienverkehr und 1,1 % im Linienverkehr mit Omnibussen. Andererseits kamen 14 Unternehmen 2016 neu hinzu, die im 4. Quartal 2016 1,7 % bzw. 3,1 % der Fahrgäste beförderten. Diese Strukturveränderung wirkt, flüchtig betrachtet, unspektakulär. Dennoch beeinflusst sie die Interpretation der Statistik deutlich. Aus den auf Seite 6 und Seite 7 dargestellten Ergebnissen wird ersichtlich, dass die Veränderung der Fahrgastzahlen ganz andere Schlussfolgerungen nahelegt, wenn bereits in das 4. Quartal 2015 nicht mehr die 7 „zu klein gewordenen“ Unternehmen und statt dessen die 14 „hineingewachsenen“ Unternehmen einbezogen worden wären.

Tabelle 1: Unternehmen und Fahrgäste im hessischen Liniennahverkehr für des Vierteljahr 2016 und 4. Vierteljahr 2015

Verkehrsart/VerkehrsmittelUnternehmenFahrgäste in Millionen
4. Vierteljahr 2016
Liniennahverkehr insgesamt81519,2
darunter mit Omnibussen7173,9
4. Vierteljahr 2015
Liniennahverkehr insgesamt74510,9
darunter mit Omnibussen6673,1

Ansätze zur Schätzung der „zutreffenden“
Veränderung

Die Statistik soll anhand der Meldungen der „marktrelevanten“ Einheiten Auskunft über das Angebot und die Anbieterstruktur beim Personenverkehr geben. Die bisherigen Ausführungen verdeutlichen, dass eine einfache Gegenüberstellung der aggregierten Daten, die bei den zur vierteljährlichen Personenverkehrsstatistik herangezogenen Einheiten erhoben wurden, zu Verzerrungen bei der Beurteilung der Entwicklungen führt. Abhilfe kann eine Schätzung schaffen, die die willkürliche, d. h. weder im Betrachtungsgegenstand begründete noch zufällige, Vermehrung der Untersuchungseinheiten entweder ausblendet oder ausgleicht. Ob die Neuaufnahmen bereits im Vorjahr „marktrelevant“ waren, wissen wir nicht. Wir kennen nur die Ergebnisse der Totalerhebung und wissen, dass auf ihrer Grundlage einige Einheiten ausscheiden und andere hinzutreten. Wie oben angedeutet, müssen die unterschiedlichen Gegebenheiten bei den Verkehrsarten und -mitteln berücksichtigt werden. Für diesen Zweck eignet sich ein statischer Ansatz mit festen Effekten14:

Yit = αi + γ · β · Xit + uit

mit i und t als Bezeichner für Untersuchungseinheit bzw. -periode, Y<sub>it</sub> als abhängige Variable (z. B. Anzahl der Fahrgäste im Quartal) und X <sub>it</sub> als Vektor der individuellen, zeitveränderlichen Eigenschaften von Einheit i (z. B. Kundenakzeptanz oder Anzahl der bedienten Nahverkehrslinien). α<sub>i</sub> bezeichnet die idiosynkratischen, in der Zeit konstanten Eigenschaften von Einheit i (z. B. Einheit i betreibt Omnibusse). γ ist ein zeitlicher Trend (z. B. zunehmende Konkurrenzfähigkeit des ÖPNV-Angebots), β gibt den jeweiligen Einfluss der beobachteten Eigenschaften X<sub>i</sub> auf die abhängige Variable wieder, und u<sub>it</sub> ist ein stochastischer Störterm, der sämtliche übrigen Einflüsse widerspiegelt.

Die Befragungsteilnahme an der vierteljährlichen Personenverkehrsstatistik wird durch zwei Effekte determiniert: Überschreiten der Abschneidegrenze in der letzten Totalerhebung (gesetzlich festgelegtes Kriterium – fixer Effekt) und Fortführung der Tätigkeit (keine Insolvenz usw.; variabler Effekt). Andere mögliche Einflüsse unterdrückt die gesetzliche Auskunftspflicht. Anhand der Eigenschaften des mathematischen Verfahrens werden im Folgenden zwei Ansätze zur adäquaten Berechnung von Veränderungsraten beurteilt.

Der Schnittmengenansatz bittet die Paare aufs Parkett

Auf individueller Ebene kann die Entwicklung bei denjenigen Untersuchungseinheiten, für die Meldungen zu beiden Perioden vorliegen, unmittelbar bestimmt werden. Um von dieser Teilmenge auf die Gesamtentwicklung schließen zu können, müssen die Gründe für den Verbleib im Panel bzw. das Ausscheiden und die Neuaufnahme berücksichtigt werden. Anders als bei einer Zufallsstichprobe weicht der Berichtskreis bei einer Vollerhebung mit Abschneidegrenze strukturell von der Grundgesamtheit ab. Die damit verbundene Verzerrung muss analytisch ausgeglichen werden.15

Würde das Bestehen der Meldepflicht unabhängig von den Erhebungsinhalten festgestellt, könnte eine Zufälligkeit der Erhebungsteilnahme bestehen. Dann läge keinerlei struktureller Einfluss durch Änderungen der Panelteilnehmer bzw. des Berichtskreises vor. Neuaufnahmen in den Berichtskreis und das Ausscheiden von Einheiten aus der Erhebung würden das Kriterium „Missing Completely At Random“ (MCAR) erfüllen. Unter dieser Bedingung könnten Veränderungsraten allein anhand der Meldedaten derjenigen Einheiten, die an den Erhebungen für das gleiche Quartal beider aufeinander folgender Berichtsjahre teilnahmen, geschätzt werden.16 Dieser Ansatz führt zu den in Tabelle 2 dargestellten Ergebnissen. Sie ergeben eine fast unveränderte Fahrgastzahl (+ 0,02 %) im Linienverkehr insgesamt und einen Rückgang bei Omnibussen von 1,0 %.

Tabelle 2: Fahrgäste im hessischen Liniennahverkehr bei Unternehmen, die sowohl im 4. Vierteljahr 2015 als auch im 4. Vierteljahr 2016 meldepflichtig waren

Verkehrsart/VerkehrsmittelUnternehmenFahrgäste in Millionen
4. Vierteljahr 2016
Liniennahverkehr insgesamt67510,3
darunter mit Omnibussen5971,6
4. Vierteljahr 2015
Liniennahverkehr insgesamt67510,2
darunter mit Omnibussen5972,3

In der Praxis kommt dieser Ansatz z. B. als „Paarigkeitskonzept“ bei der Konjunkturstatistik im Baugewerbe zum Einsatz.17 Hier fließen die Angaben zu einer großen Anzahl an Untersuchungseinheiten und aus jeweils zwei alternativen Datenquellen ein. Im Unterschied zu den Personenverkehrsstatistiken gehen alle Veränderungen im Berichtskreis fortlaufend in die Befragung ein. Allerdings ist die Meldepflicht zur vierteljährlichen Personenverkehrsstatistik in Abhängigkeit von dem Erhebungsmerkmal „Fahrgäste“ geregelt. Das MCAR-Kriterium ist somit nicht erfüllt. Deshalb und wegen der kleinen Berichtskreise kommt der Ansatz für die Personenverkehrsstatistik nicht infrage. Folglich ist es sinnvoll, in einem erweiterten Ansatz zusätzlich die Informationen aus den neu aufgenommenen Untersuchungseinheiten zu verwenden und Annahmen über deren individuelle Entwicklung zu treffen, wie von Hirano u. a.18 aufgezeigt.

Der Imputationsansatz ergänzt virtuelle Partner

Über den vorgenannten Ansatz hinaus benötigt das anzuwendende Schätzverfahren einen Mechanismus, der an der Bruchstelle, wenn der Berichtskreis nach der Totalerhebung neu gebildet wird, die Voraussetzungen für eine Panelanalyse schafft. Für einige Untersuchungseinheiten liegen tatsächlich Meldedaten zu beiden Beobachtungsperioden der vierteljährlichen Personenverkehrsstatistik vor. Bei den übrigen Untersuchungseinheiten mit Beobachtungen für nur eine Periode sollen die Lücken durch die Imputation plausibler „Partner“-Werte geschlossen werden. Einen Ansatz, hierfür Informationen aus Querschnittsdaten für Panelanalysen zu nutzen, stellen Bruno und Stampini19 vor. Analog dazu verwenden wir die Jahreserhebung zur Personenverkehrsstatistik als Quelle für Zusatzinformationen über die Marktstruktur. Die Zusatzinformationen ermöglichen es, fehlende Werte zu schätzen. Allerdings weicht das hier behandelte Schätzverfahren insofern von Bruno und Stampini ab, als die Zusatzinformationen keine Gruppeneigenschaften, die auf mehrere Individuen zutreffen können, abbilden. Stattdessen sind in der hier verwendeten Adaption Ausprägungen der abhängigen Variablen aus vier aufeinander folgenden Quartalen zum Jahreswert der einzelnen Untersuchungseinheit aggregiert. Um die aktuelle Entwicklung möglichst gut abbilden zu können, sollen die Untersuchungseinheiten aus der jüngeren Periode vollständig berücksichtigt werden. Dieser Berichtskreis ergibt implizit die Marktstruktur mit allen Charakteristika der Anbieter, die nun auch der vorausgehenden Vergleichsperiode zugrunde gelegt wird: Die „zu klein gewordenen“ Anbieter werden überhaupt nicht berücksichtigt. Für die 2016 erstmalig befragten Untersuchungseinheiten werden Vergleichswerte für die Quartale des Jahres 2015 durch das Schätzverfahren ermittelt. Das ist möglich, weil sich die Auswahlgrundlage für den Berichtskreis zur Jahreserhebung 2015 bereits auf die Ergebnisse der Totalerhebung 2014 stützte und neu festgelegt wurde.

In der oben eingeführten mathematischen Form ermitteln wir die unbeobachteten Quartalswerte Ŷit,s für die neu aufgenommenen Unternehmen durch eine saisonale Aufteilung der Inanspruchnahme des Beförderungsangebots im Jahr t: Xit. Der Index s zeigt die unterjährige Aufteilung in Quartale an. Der Parameter β fungiert nun als Saisonkomponente βs:

Abhängig von der Verkehrsart gibt βs: für jedes Quartal s ( I., II., III., IV. Quartal) die durchschnittlichen Anteile an der Jahressumme an. Die Berechnung fußt auf der relativen Abweichung des saisonalen Mittelwerts Ȳs vom Gesamt-Mittelwert Ȳ der abhängigen Variable, wobei Letzterer mit der Anzahl der unterjährigen Abschnitte s gewichtet wird . Ȳ wird aus allen vorliegenden Beobachtungen über alle Jahre des Beobachtungszeitraums T ermittelt:

Analog zur Berechnung des Gesamt-Mittelwerts Ȳ bezieht der saisonale Mittelwert Ȳs nur die jeweiligen Quartalswerte ein.

Für die Mittelwertbildung standen die deutschlandweiten Quartalsdaten aus den Erhebungen der Jahre 2004 bis 2016 zur Verfügung. Das Schätzmodell modellierte das Statistische Bundesamt in SAS-Programmcode.

Die Anwendung des Schätzmodells auf die 14 hessischen Untersuchungseinheiten, die 2016 neu zu ihrer vierteljährlichen Transportleistung im Linienverkehr befragt wurden, führt zu dem in Tabelle 3 dargestellten Ergebnis. Für den hessischen Liniennahverkehr im 4. Quartal 2016 resultiert nun gegenüber dem Vorjahresquartal ein Rückgang von 0,6 %, im Teilbereich mit Omnibussen von 3,1 %. Gegenüber der Entwicklung, die allein aus den in Tabelle 1 dargestellten Erhebungsergebnissen abgeleitet ist, haben sich bei Berücksichtigung zusätzlicher Informationen über strukturelle Änderungen die Vorzeichen umgedreht.

Tabelle 3: Gemessene und berechnete Fahrgäste im hessischen Liniennahverkehr bei Unternehmen, die im 4. Vierteljahr 2016 meldepflichtig waren

Verkehrsart/VerkehrsmittelUnternehmenFahrgäste in Millionen
4. Vierteljahr 2016
Liniennahverkehr insgesamt81519,2
darunter mit Omnibussen7173,9
4. Vierteljahr 2015 (einschließlich Schätzwerte)
Liniennahverkehr insgesamt81522,3
darunter mit Omnibussen7176,2

Abbildung 4 fasst die Ergebnisse des Imputationsverfahrens schematisch zusammen. Zunächst zeichnet der grüne Graph die vierteljährlichen Fahrgastzahlen nach, die im Berichtsjahr mit dem neu gebildeten und im Vorjahr mit dem abgelösten Berichtskreis erhoben wurden. Den normalen Saisonverlauf stellt der rote Graph als quartalsweise Abweichung vom Jahresdurchschnitt dar. Dieser beruht auf einer Auswertung aller Quartalsmeldungen zu den Berichtsjahren 2004 bis 2016. Mittels einer Regression wurde die durchschnittliche Aufteilung auf die Quartale berechnet. Der blaue Graph skizziert die um Schätzungen für fehlende Werte ergänzten Vergleichswerte für das Vorjahr.

Abbildung 4: Schematische Darstellung der Berechnung von Vergleichswerten für das Vorjahr

Fazit

Die klassische Wirtschaftstheorie geht davon aus, dass sich der Markt verändert, wenn auf der Angebotsseite Innovationen eingeführt werden oder sich das Nachfrageverhalten ändert. Der Bereich des öffentlichen Personennahverkehrs stellt jedoch insofern einen unvollkommenen Markt dar, als die zu erbringenden Leistungen sinnvollerweise für einen begrenzten Zeitraum ausgeschrieben und an einzelne Auftragnehmer vergeben werden. Hierdurch verschieben sich Marktanteile der Angebotsseite nicht „kontinuierlich“, sondern „stufenweise“. Solange sich die üblichen Vorgänge der Marktbereinigung in Form von Übernahmen (der ausgeschriebenen Linien wie auch ganzer Unternehmen) innerhalb desselben Bundeslandes durch bereits meldepflichtige Unternehmen vollziehen, stellt die vierteljährliche Personenverkehrsstatistik das Geschehen korrekt dar. Jedoch bringt das bestehende System verzerrte Ergebnisse hervor, sobald sich mehrere Omnibusunternehmen zusammenschließen oder Nahverkehrslinien an Unternehmen in einem anderen Bundesland vergeben werden.

Die Vorgehensweise der amtlichen Statistik in Deutschland, Befragungen bei Unternehmen und ihren Niederlassungen überwiegend als Vollerhebungen durchzuführen und die Belastung durch Abschneidegrenzen zu senken, führt faktisch zu Paneldatensätzen. Die Vorteile, die aus der Möglichkeit zur Beobachtung individueller Entwicklungen bei denselben „Erbsen“ resultieren, nimmt auch die Wissenschaft über die Angebote der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder gern an. In der Tat bedarf die Interpretation der statistischen Ergebnisse eines tieferen Verständnisses der darin zusammengefassten Entwicklungen einzelner Untersuchungseinheiten bzw. Gruppen von ihnen. Das zeigt sich besonders bei Statistiken, deren Berichtskreis bzw. „Erbsenbeet“ klein ist und/oder nur in größeren zeitlichen Abständen nach- bzw. neu bepflanzt, d. h. an strukturelle Gegebenheiten angepasst wird. Beides ist bei der vierteljährlichen Personenverkehrsstatistik der Fall.

Das Design der Gesamtheit der Personenverkehrsstatistiken lässt die Bewältigung der methodischen Herausforderungen, die die konjunkturelle Beobachtung an sie stellt, prinzipiell zu. Die vollständige Integration des vorgestellten Schätzverfahrens in die Ergebniserstellung der vierteljährlichen Personenverkehrsstatistik scheitert jedoch unter den heutigen Gegebenheiten an einer zeitlich-organisatorischen Grenze der Durchführbarkeit. In der Praxis stehen nach einer Umstellung des Berichtskreises die Ergebnisse der Jahreserhebung erst bereit, wenn das Quartalsergebnis für das 3. Quartal des Folgejahres veröffentlicht werden soll. Für die ersten beiden Quartale kann das verbesserte Berechnungsverfahren für Veränderungsraten nur nachträglich angewandt werden. Ob die Ergebnisse der vierteljährlichen Personenverkehrsstatistik des Jahres 2020 einschließlich Veränderungsraten veröffentlicht werden, wird von der Entwicklung der organisatorischen und rechtlichen Voraussetzungen auf Bundesebene abhängen.

Ausblick

Möglichkeiten zur Weiterentwicklung des Schätzverfahrens bestehen in der Differenzierung der Schätzfunktion hinsichtlich der Unternehmensstruktur der Neuaufnahmen. Der Imputationsmechanismus könnte beispielsweise anhand der aktuellen Daten des Unternehmensregisters zu Beschäftigten und dergleichen verfeinert werden. Durch weitere Forschung stellen sich womöglich weitere schnell verfügbare Variablen als relevant heraus. Diese Prüfung wird wichtig, wenn im VerkStatG der starre Rahmen für die Aufnahme neuer Berichtseinheiten zu den Personenverkehrsstatistiken flexibilisiert wird. Neben der vierteljährlichen Personenverkehrsstatistik können auch bei den Jahresergebnissen bestehende Unschärfen ausgeglichen werden. Beispielsweise wird eine (kartellrechtlich interessante) Betrachtung von Konzentrationsmaßen wie z. B. dem Gini-Koeffizienten von den oben genannten Verzerrungen beeinflusst.

Die Verzerrung, die sich aus der länderübergreifenden Tätigkeit der Akteure im Verkehrsmarkt ergibt, lässt sich jedoch mittels Schätzverfahren nicht zufriedenstellend ausgleichen. Hierbei schafft nur eine nach dem Land der Leistungserbringung differenzierte Erfassung der Verkehrsleistungen Abhilfe. Damit würde bei der vierteljährlichen Personenverkehrsstatistik der mit der Datenerhebung verbundene Aufwand steigen. Es wäre zu untersuchen, ob belastbare Ergebnisse erzielt werden, wenn dies durch eine Anhebung der Abschneidegrenze ausgeglichen würde.

Auf längere Sicht birgt die Digitalisierung das Potenzial, statistische Auswertungen kostengünstig zu erstellen. Die Verkehrsbeobachtungssysteme der Anbieter umfassen die maßgeblichen Daten, auf die sich die Personenverkehrsstatistiken stützen. Mit dem Übergang von einer erhebungsbasierten Ergebniserstellung hin zur Auswertung dieser Datensammlungen würde sich die Statistik ganz im Sinne der Empfehlungen des Statistischen Beirats20 weiterentwickeln: Die Aktualität und die Datenqualität ließen sich erhöhen und gleichzeitig die Belastung verringern.

Literaturverzeichnis

Andreas Broscheid und Thomas Gschwend: Augäpfel, Murmeltiere und Bayes: Zur Auswertung stochastischer Daten aus Vollerhebungen; Max-Planck-Institut für Gesellschaftsforschung (Hg.): MPIfG Working Paper 03/7; Köln 2003.

Randolf Bruno und Marco Stampini: Joining Panel Data with Cross-Sections for Efficiency Gains: An Application to a Consumption Equation for Nicaragua; Forschungsinstitut zur Zukunft der Arbeit (Hg.): IZA Discussion Paper No. 3231; Bonn 2007.

Jens Dechent: Die Mixmodelle in den Konjunkturstatistiken des Bauhaupt- und Ausbaugewerbes; in: Thüringer Landesamt für Statistik (Hg.): Statistisches Monatsheft Thüringen 29/18; Erfurt 2018; S. 31-46.

Tobias Gramlich, Tobias Bachteler, Bernhard Schimpl-Neimanns und Rainer Schnell: Panelerhebungen der amtlichen Statistik als Datenquellen für die Sozialwissenschaften; Rat für Sozial- und Wirtschaftsdaten (Hg.): Working Paper Nr. 132; Berlin 2009.

Marine Guillerm: Les méthodes de pseudo-panel; Institut national de la statistique et des études économiques (Hg.): Méthodologie Statistique M 2015/02; Paris 2015.

James Joseph Heckman: The Common Structure of Statistical Models of Truncation, Sample Selection and Limited Dependent Variables and a Simple Estimator for such Models; in: Annals of Economic and Social Measurement, 5(4); Cambridge (Mass.) 1976; S. 475-492.

Keisuke Hirano, Guido W. Imbens, Geert Ridder und Donald B. Rubin: Combining Panel Data Sets with Attrition and Refreshment Samples; National Bureau of Economic Research (Hg.): NBER Technical Working Paper Nr. 230; Cambridge (Mass.) 1998.

Keisuke Hirano, Guido W. Imbens, Geert Ridder und Donald B. Rubin: Combining Panel Data Sets with Attrition and Refreshment Samples; in: Econometrica, 69 (6); New York 2001; S. 1645- 1659.

Dennis Pfeiffer-Goldmann: Viabus übernimmt am Sonntag in Nidderau; in: Frankfurter Neue Presse vom 20.06.2018 (abgerufen am 03.09.2018); http://ndp.fnp.de/lokales/wetterau/Viabus-uebernimmt-am-Sonntag-in-Nidderau;art677,3022513.

Matthias Pieren: Busfahrer packt aus: Daher kommt das Bus-Chaos; in: Frankfurter Neue Presse vom 21.12.2016 (abgerufen am 03.09.2018); http://www.fnp.de/rhein-main/Busfahrer-packt-aus-Daher-kommt-das-Bus-Chaos;art801,2384183.

Anke Rink, Ines Seiwert und Rainer Opfermann: Unternehmensdemografie: methodischer Ansatz und Ergebnisse 2005 bis 2010; in: Statistisches Bundesamt (Hg.): Wirtschaft und Statistik 6/2013; Wiesbaden 2013; S. 422-439.

Jhon James Mora Rodríguez und Juan Muro: Consistent Estimation in Pseudo Panels in the Presence of Selection Bias; in: Economics, 8 (2014-43); o.O. 2014.

Statistischer Beirat (Hg.): Fortentwicklung der amtlichen Statistik – Empfehlungen des Statistischen Beirats für die Jahre 2018 bis 2022; Wiesbaden 2018.

Statistisches Bundesamt (Hg.): Qualitätsbericht: Erhebung bestimmter klimawirksamer Stoffe; Wiesbaden, versch. Jahre.

Marno Verbeek: Pseudo-Panels and Repeated Cross-Sections; in: László Mátyás und Patrick Sevestre (Hg.): The Econometrics of Panel Data; Berlin 2008; S. 369-383.

Beitrag drucken
  1. Bundessstatistikgesetz (BStatG) vom 22. Januar 1987 (BGBl. I S. 462, 565) in der Fassung der Bekanntmachung vom Oktober 2016 (BGBI. I S. 2394), zuletzt geändert durch Artikel 10 Absatz 5 des Gesetzes vom 30. Oktober 2017 (BGBI. I S. 3618).
  2. Der Vollständigkeit wegen sei auch auf Fährverbindungen hingewiesen. Sie spielen jedoch im deutschen Sprachraum abseits der Meeresküsten nur lokal eng begrenzt eine Rolle und werden dort nicht statistisch erfasst.
  3. Verkehrsstatistikgesetz (VerkStatG) in der Fassung der Bekanntmachung vom 20. Februar 2004 (BGBI. I S. 318), zuletzt geändert durch Artikel 8 des Gesetzes vom 24. Mai 2016 (BGBI. I S.1217).
  4. Vgl. Dennis Pfeiffer-Goldmann, 2018; Frankfurter Neue Presse vom 20.06.2018.
  5. Vgl. Matthias Pieren, 2016; Frankfurter Neue Presse vom 21.12.2016.
  6. Vgl. Broscheid und Gschwend, 2003, S. 14.
  7. Vgl. Heckman, 1976, S. 475 f.
  8. Vgl. Gramlich u. a., 2009, S. 5.
  9. Da die Struktur des Gesamtmarkts nur alle 5 Jahre vollständig erfasst wird, steigt die statistische Unsicherheit bis zur nächsten Totalerhebung an.
  10. Vgl. Rodríguez und Muro, 2014, S. 3 ff.
  11. S. Gramlich u. a., 2009, S. 4 f. Vgl. auch Guillerm, 2015, S. 3.
  12. Eine umfassende Begriffsdefinition sowie methodische und organisatorische Erläuterungen bieten Rink u. a., 2013
  13. Eine jährliche Berichtskreisbestimmung auf Grundlage von Erhebungsmerkmalen erfolgt z. B. bei der jährlichen Erhebung bestimmter klimawirksamer Stoffe. Hier ist die Grundgesamtheit unbekannt und unterliegt von Jahr zu Jahr erheblichen Veränderungen. Dieses Vorgehen bezieht zwangsläufig Unternehmen ein, die nichts zum Erhebungsgegenstand beitragen. Vgl. Statistisches Bundesamt (Hg.), versch. Jahre, S. 8.
  14. Vgl. Verbeek, 2008,
    S. 370 f.; vgl. Bruno und Stampini, 2007, S. 5 f.
  15. Vgl. Heckman, 1976, S. 476.
  16. Vgl. Hirano u. a., 1998, S. 7 f.
  17. Vgl. Dechent, 2018, S. 39.
  18. Vgl. Hirano u. a., 2001, S. 1647.
  19. Vgl. Bruno und Stampini, 2007, S. 4 ff.
  20. Vgl. Statistischer Beirat, 2018, S. 9 ff.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.