Tourismus

Anonyme Mobilfunkdaten für die Tourismusstatistik? Ergebnisse einer Pilotstudie

Lesedauer: 14 Minuten

Mobilfunk gehört zweifellos zu den prägendsten Technologien der vergangenen Jahrzehnte und wird auch weiter den Alltag von Wirtschaft und Gesellschaft durchdringen (ITU 2018, GSMA 2020). Die Daten, die bei der Nutzung von Mobilfunk entstehen, liefern ein Abbild der Menge der Handynutzerinnen sowie Handynutzer und könnten damit als sinnvolle Ergänzung in der amtlichen Statistik verwendet werden. Die nachfolgende Pilotstudie zeigt auf, ob und wie anonyme Mobilfunkdaten für die Tourismusstatistik genutzt werden können.

Von Tobias Gramlich, Hessisches Statistisches Landesamt

Die Idee

Hinter der Pilotstudie steckt die Überlegung, dass mit anonymen Mobilfunkdaten festgestellt werden kann, wie viele Menschen sich während einer bestimmten Zeit in einer bestimmten Region aufhalten. Aus den Mobilfunkdaten lässt sich zudem entnehmen, ob es sich bei dem jeweiligen Mobilfunkgerät, d. h. bei dessen Besitzerin bzw. Besitzer, in der jeweiligen Region um eine Touristin bzw. einen Touristen, eine pendelnde Arbeitnehmerin bzw. einen pendelnden Arbeitnehmer („Tagespendlerin bzw. Tagespendler“) oder einen Teil der Wohnbevölkerung handelt. Auf diese Weise ließen sich Gästeankünfte und Gästeübernachtungen der Beherbergungsstatistik erfassen. Ein langfristiges Ziel der amtlichen Statistik ist es, mit Nutzung dieser Daten auf Teile der Erhebung bei Beherbergungsbetrieben zu verzichten und Betriebe zu entlasten.

Warum eignen sich Daten aus Mobilfunknetzwerken?

Aus verschiedenen Gründen liegt es nahe, dass sich Mobilfunkdaten für den Einsatz in der amtlichen Statistik eignen:

  • Nach Ergebnissen der laufenden Wirtschaftsrechnungen der privaten Haushalte (LWR) 2020 (Statistisches Bundesamt 2020a), verfügen über 97 Prozent aller Haushalte in Deutschland über mindestens ein Mobiltelefon, das in über 84 Prozent der Fälle ein Smartphone ist. In Deutschland kommen auf 100 Haushalte über 185 Mobiltelefone, darunter über 155 Smartphones. Die Bundesnetzagentur (2020) berichtet in ihrem aktuellsten Jahresbericht von einem Bestand von 139 Millionen SIM-Karten (Abbildung 1), von denen knapp 107 Millionen aktiv genutzt werden. Auf jeden Haushalt kommt im Durchschnitt so mehr als ein Gerät bzw. auf jede Person mehr als eine SIM-Karte.
  • Neben der ausreichenden personellen Ausstattung ist auch eine gute räumliche Abdeckung mit Mobilfunk eine Voraussetzung. Hierfür reicht prinzipiell eine „einfache“ Anbindung an das Mobilfunknetz aus (mind. GSM/GPRS),

Abbildung 1: Anzahl SIM-Karten (in Millionen) und Anzahl SIM-Karten je 100 Personen in Deutschland 1990-2019

  • Die Komponenten von Mobilfunknetzwerken stehen in häufigem Kontakt miteinander, z. B. um ein- oder ausgehende Anrufe zu tätigen, um Internetverbindungen aufzubauen und entsprechende Datenpakete zu versenden oder zu empfangen oder um Kurzmitteilungen zu übermitteln. Je nach Nutzungsart und -intensität verschiedener mobiler Dienste entstehen jeden Tag etwa 150 Kontakte zwischen mobilem Endgerät und der restlichen Netzwerkinfrastruktur.

Die Kombination aus sehr hohem Ausstattungsgrad, hoher räumlicher Abdeckung und hoher räumlicher Dichte der Signale und Informationen, die dabei im Netzwerk entstehen, macht Daten aus Mobilfunknetzwerken zu einer wichtigen Datenquelle für statistische Zwecke (Blondel u. a. 2015, de Jonge u. a. 2012). Sie könnten überall dort eingesetzt werden, wo die Anzahl von Personen an bestimmten Orten zu bestimmten Zeiten gezählt werden soll, z. B. in den Bereichen

  • Bevölkerung (Mobilität; Tages- vs. Nachtbevölkerung, Migration, z. B. Palmer u. a. 2013, Douglass u. a. 2015, Deville u. a. 2014),
  • Verkehr und Verkehrsflüsse (statisch, als auch dynamisch; z. B. Schmidt und Männel 2017),
  • Tourismus (Übernachtungs-, Tages- und Eventtourismus, siehe z. B. Eurostat 2017, Reif und Schmücker 2020; Saluveer u. a. 2020),
  • Stadt- und Verkehrsplanung (z. B. Ratti u. a. 2006),
  • Katastrophenhilfe (z. B. Lu u. a. 2012, Statistics New Zealand 2012),
  • Epidemiologie (z. B. Tizzoni u. a. 2014, Milusheva 2020; Wesolowski u. a. 2013, 2016),
  • aber auch zur Untersuchung anderer sozioökonomischer Phänomene (z. B. Wohlstand, Bildungsstand, Arbeitslosigkeit; z. B. Blumenstock u. a. 2015, Toole u. a. 2015, Schmid u. a. 2017).

Besondere Bedeutung hat die Nutzung von Daten aus Mobilfunknetzwerken für Zwecke von Mobilitätsanalysen nicht zuletzt durch die Corona-Pandemie gewonnen (z. B. Kishore u. a. 2020, Schlosser u. a. 2020).1

Die amtliche Statistik auf nationaler und internationaler Ebene prüft den Einsatz von Daten aus Mobilfunknetzwerken bereits seit längerem (UNSD 2019; Eurostat 2014).2 Die Digitale Agenda des Statistischen Bundesamtes führt „Auswertung von Mobilfunkdaten“ auch als eines der Leuchtturmprojekte auf (Statistisches Bundesamt, 2019). In die Produktion amtlicher Statistiken sind solche Daten bislang noch nicht eingegangen, aber verschiedene statistische Ämter veröffentlichen sogenannte „experimentelle Statistiken“ oder „Beta-Produkte“ auf Grundlage solcher Daten.3

Methodisches

Der Schwerpunkt dieser Pilotstudie liegt darauf, die Eignung anonymer Daten aus Mobilfunknetzwerken für eine Tourismusstatistik zu prüfen. Für statistische Zwecke wird dazu ein bestimmtes geographisches Gebiet (z. B. Bundesländer, Landkreise, Städte und Gemeinden) in kleinere räumliche Einheiten aufgeteilt.4

In diesen kleineren Einheiten („Verkehrszellen“) lassen sich nun Ereignisse im Mobilfunknetzwerk bestimmen bzw. zählen und dann aggregiert ausweisen. Abbildungen 2 und 3 zeigen eine Aufteilung des Landes Hessens bzw. der kreisfreien Stadt Wiesbaden in diese kleineren Einheiten. Deutlich sichtbar ist in Abbildung 2 die höhere Dichte kleinerer Mobilfunk-Verkehrszellen in Ballungsgebieten: Das Rhein-Main-Gebiet zwischen Hanau, Offenbach am Main, Frankfurt am Main bis Wiesbaden, weiter südöstlich Darmstadt, im Norden Kassel, östlich Fulda und in der Mitte die Städte Gießen, Marburg und Wetzlar. Hier sind die Verkehrszellen, für die Ereignisse im Mobilfunknetz erfasst und ausgewiesen werden können, kleiner, wohingegen in weniger urbanen Gebieten Verkehrszellen v. a. aus Datenschutzgründen größere Gebiete abdecken.

Abbildung 2: Umrisse des Bundeslandes Hessen und Unterteilung in kleinere geographische Einheiten, in denen Ereignisse im Mobilfunknetzwerk gezählt oder aggregiert ausgewiesen werden

In Abbildung 3 werden beispielhaft zusätzlich einige Beherbergungsbetriebe dargestellt, die in einem Internetportal zum Zwecke der Buchung oder Bewertung inserieren. Ein Teil der „Gästeankünfte“ oder „Gästeübernachtungen“, die nun über anonyme Daten aus Mobilfunknetzwerken erfasst werden sollen, wird derzeit noch bei Beherbergungsbetrieben für die monatliche Beherbergungsstatistik (Statistisches Bundesamt 2020b) per Erfragung erhoben. Mit Mobilfunkdaten könnte man eine Beherbergungsstatistik erstellen, ohne monatlich alle Beherbergungsbetriebe nach der Anzahl der Gästeankünfte und -übernachtungen befragen zu müssen. Außerdem könnte die Amtliche Statistik zusätzliche Tourismusbereiche erfassen, die von der Beherbergungsstatistik bislang nicht abgedeckt werden: Den Eventtourismus (z. B. Hallenkonzerte, Fußballspiele im Stadion), den Tagestourismus und den privaten Übernachtungstourismus (z. B. AirBnB, private Übernachtungen bei Freunden oder Verwandten).

Abbildung 3: Umrisse der kreisfreien Stadt Wiesbaden und Unterteilung in kleinere geographische Einheiten, auf die Ereignisse im Mobilfunknetzwerk aggregiert werden können. Zusätzlich eingezeichnet sind Beherbergungsbetriebe aus einem Internet-Buchungsportal.

Exkurs: Anonymisierung
Alle Datenaufbereitungen finden beim Mobilfunkanbieter in speziell gesicherten Rechenzentren statt. Weder der Projektpartner noch das Hessische Statistische Landesamt (HSL) hatten oder haben Zugriff auf Einzeldaten. Zusammengefasste Ergebnisse werden erst an das HSL übermittelt, wenn mindestens 5 Signale (Geräte) pro Zeiteinheit oder räumlicher Einheit erfasst sind. So sind aus den Ergebnissen zu keinem Zeitpunkt Rückschlüsse auf einzelne bestimmte Geräte oder Personen möglich. Im Mobilfunknetz werden stabile und eindeutige Identifikatoren (IMSI, International Mobile Subscriber Identity) durch Pseudonyme (TIMSI, temporary IMSI) ersetzt und diese Pseudonyme im Rahmen der weiteren Aufbereitung alle 24 Stunden durch neue, unumkehrbare nicht-sprechende ID-Nummern ersetzt. Dadurch ist gewährleistet, dass keine längeren zeitlichen Verläufe über 24 Stunden hinaus gebildet werden und damit eine De-Anonymisierung durch identifizierende zeitliche Muster ausgeschlossen ist. Eine Anonymisierung findet auch durch räumliche Zusammenfassung von Signalen aus Mobilfunknetzwerken statt: In Gebieten mit höherer Bevölkerungsdichte können daher Ergebnisse kleinräumiger ausgewiesen werden (siehe Abbildung 1), da auch in kleineren räumlichen Einheiten Mindestfallzahlen sichergestellt sind. Diese Anonymisierung setzt dem Auswertungspotential der Daten Grenzen und führt bereits in der Spezifikation, wie die Erhebungsmerkmale durch die Signale im Mobilfunknetzwerk abgebildet werden sollen, zu Ungenauigkeiten. Hier besteht daher auch noch großer Gestaltungsspielraum und entsprechendes Verbesserungspotential, sollte die amtliche Statistik andere, gesetzlich geregelte Zugangsmöglichkeiten zu solchen Daten erhalten. 

Tourismuskategorien – Vom Signal zur Kategorie

Um Signale im Mobilfunknetzwerk für eine Tourismusstatistik verwenden zu können, müssen sie verschiedenen Kategorien zugeordnet werden: Mit Bezug zur Beherbergungsstatistik –oder allgemeiner: zu einer Tourismusstatistik – sind das die Kategorien „Gästeankünfte“, „Gästeübernachtungen“ und – im Gegensatz zum Übernachtungstourismus – „Tagestourismus“.

Damit alle Signale genau einer Kategorie zugeordnet werden können, werden zwei weitere Kategorien benötigt, die keine Tourismuskategorie darstellen, aber zusätzlich zu den Tourismuskategorien wichtige Größen zur Evaluation darstellen: die Kategorien „Tagespendlerin bzw. Tagespendler“ und „Wohnbevölkerung“ (bzw. genauer „Nachtbevölkerung“).

Anhand verschiedener Bedingungen muss entschieden werden, auf welche Kategorien die Signale von SIM-Karten schließen lassen: Zur Kategorisierung der SIM-Karten wird der Ort des ersten und letzten Signals des Tages (3 Uhr nachts), der Ort des üblichen Aufenthalts (hier festgelegt durch den Ort der Vertragsanschrift) sowie die Uhrzeit des erstmaligen Eintritts in ein „Untersuchungsgebiet“ (vor oder nach 9 Uhr) verwendet.

Verschiedene Kategorien schließen sich nicht unbedingt gegenseitig aus: Tagestouristinnen und Tagestouristen in Gemeinde X können gleichzeitig (d. h. am selben Tag) auch Tagestouristinnen und Tagestouristen in Gemeinde Y sein, und in Gemeinde Z als Übernachtungsgäste oder zur Wohnbevölkerung gezählt werden. Tagespendlerinnen und Tagespendler können bei entsprechend langem Aufenthalt an einem anderen Ort dort als Tagestouristinnen bzw. Tagestouristen gezählt werden. Lediglich die Kategorien „Gästeübernachtung“ und „Wohnbevölkerung“ schließen sich gegenseitig aus.

Gästeankünfte

Gästeankünfte zeichnen sich dadurch aus, dass das letzte Signal des Tages an einem anderen Ort verzeichnet wird, als das erste Signal des (vorherigen) Tages. Der Ort des letzten Signals ist nicht gleich der Ort der Vertragsanschrift. Wenn diese Vertragsanschrift zur Kategorisierung nicht verwendet werden kann, wird stattdessen für Gästeankünfte für diese SIM-Karten eine niedrigere festgelegte Anzahl an Aktivitäten am Ort des letzten Signals unterstellt. Gästeankünfte bezeichnen demnach die erste Übernachtung an einem neuen Ort.5

Gästeübernachtungen

Die Kategorie der Gästeübernachtung erfasst alle weiteren Übernachtungen von Übernachtungsgästen nach der ersten Nacht der Gästeankunft. Aufgrund der notwendigen Anonymisierung kann der Status „Gästeankunft“ vom vorherigen Tag jedoch nicht zur Kategorisierung verwendet werden. Daher gelten „Gästeübernachtungen“ als SIM-Karten, bei denen das erste und letzte Signal im selben Ort verzeichnet wurde, der aber nicht gleich dem Ort der Vertragsanschrift ist.

Tagestouristinnen und Tagestouristen

Tagespendlerinnen und Tagespendler sowie Tagestouristinnen und Tagestouristen sind nicht leicht zu unterscheiden, da sich das Muster ihrer Signale kaum unterscheidet. Ebenso wie Tagespendlerinnen und Tagespendler halten sich die Tagestouristinnen und Tagestouristen tagsüber an einem anderen Ort auf als zum Zeitpunkt des ersten und letzten Signals. Im Unterschied zu den Tagespendlerinnen und Tagespendlern muss der Ort des ersten und letzten Signals bei Tagestouristinnen und Tagestouristen jedoch nicht gleich sein (z. B. Tagestouristin bzw. Tagestourist, die bzw. der im Urlaub einen Tagesausflug macht, Rundreisende). Zudem soll für Tagestouristinnen und Tagestouristen nicht die gleiche zeitliche Beschränkung gelten wie bei Tagespendlerinnen und Tagespendlern, die sich nur zu üblichen „Rush hour“-Zeiten bewegen.6

Tagespendlerinnen und Tagespendler

Tagespendlerinnen und Tagespendler sind definiert als Personen, deren Arbeitsort sich vom Wohnort unterscheidet. Tagespendlerinnen und Tagespendler kehren in der Regel an ihren Wohnort zurück. Um Tagespendlerinnen und Tagespendler sowie Tagestouristinnen und Tagestouristen unterscheiden zu können, wird zusätzlich die Uhrzeit des Aufenthalts außerhalb des Wohnortes bzw. des ersten und letzten Signals des Tages betrachtet. Personen mit Aufenthalten außerhalb dieses Ortes bereits zu üblichen „Rush hour“-Zeiten (z. B. vor 9 Uhr) werden daher als „Tagespendlerin bzw. Tagespendler“ gezählt.

Wohnbevölkerung

Die Wohnbevölkerung ist dadurch definiert, dass das erste und letzte Signal des Tages am selben Ort verzeichnet werden und dies der Ort der Vertragsanschrift ist. Zudem zeichnen sich Personen der Wohnbevölkerung durch eine geringere Mobilitätsaktivität aus. Sollte keine Vertragsanschrift zur Klassifikation vorliegen, wird eine maximale Mobilität bzw. Aktivität, also eine maximale Anzahl an Signalen an diesem Ort, unterstellt, die für eine Klassifikation in die Kategorie „Wohnbevölkerung“ nicht überschritten werden darf.

Ergebnisse

Die Daten aus Mobilfunknetzwerken – genauer: die Anzahl an SIM-Karten je Region, deren Signale zu einer bestimmten Zeit in einer bestimmten Region erfasst waren – liegen nur als Tagessummen und durchschnittliche Stundensummen vor. Ein Vergleich mit Ergebnissen der monatlichen Beherbergungsstatistik ist nicht überall möglich, da dort Monatssummen berichtet werden, die hier aus den Tagessummen oder durchschnittlichen Stundensummen nicht für alle Tourismuskategorien sinnvoll berechnet werden können. Denn infolge der Anonymisierung der Daten können Duplikate nicht mehr identifiziert und entfernt werden (siehe Exkurs „Anonymisierung“: keine zeitliche „Profilbildung“ über 24 Stunden hinaus). Zudem fehlen für einige Kategorien tägliche oder monatliche Vergleichsgrößen (z. B. Tagessummen für Gästeankünfte oder -übernachtungen, Summen der täglich oder monatlich pendelnden Personen).

Gästeankünfte und Gästeübernachtungen

Die monatlichen absoluten Summen zu Gästeankünften oder Gästeübernachtungen aus der Beherbergungsstatistik (Hessisches Statistisches Landesamt 2020) mit aggregierten Daten aus Mobilfunknetzwerken zu vergleichen, ist nicht möglich, da in dieser Arbeit nur Daten eines einzelnen Mobilfunkanbieters verwendet wurden und dadurch eine erhebliche Verzerrung auch hochgerechneter Ergebnisse zu erwarten ist. Zudem ließe sich die Unsicherheit der hochgerechneten Ergebnisse nicht angeben.

Zur monatlichen Anzahl der Gästeankünfte und Gästeübernachtungen lassen sich also mit den hier verwendeten Mobilfunkdaten leider keine sinnvollen Aussagen treffen. Daher wird der Fokus im Folgenden v. a. auf plausible zeitliche Muster der Summen für die Kategorien „pendelnde Personen“ und „Tagestourismus“ gerichtet.

Tagespendlerinnen und Tagespendler sowie Tagestouristinnen und Tagestouristen

Abbildung 4 zeigt die durchschnittliche Anzahl an Pendlerinnen bzw. Pendlern und Tagestouristinnen bzw. Tagestouristen aus den Mobilfunkdaten nach Wochentag und Monat – jeweils gemessen an der jeweiligen Monatssumme. Bei Gleichverteilung entfielen von der gesamten Monatssumme einer Kategorie 100 Prozent / 7 Wochentage = 14,3 Prozent auf jeden Wochentag. Abbildung 4 zeigt nun die tatsächlichen Anteile nach Wochentag und Monat. Die Verläufe der Kurven für Pendlerinnen bzw. Pendler und Tagestouristinnen bzw. Tagestouristen sind sehr ähnlich. Für Pendlerinnen und Pendler ist die Dynamik deutlich größer als im Tagestourismus. Beiden gleich ist hingegen der unterdurchschnittliche Anteil der Wochenenden an der monatlichen Gesamtsumme. Insbesondere für Pendlerinnen bzw. Pendler ist das erwartbar und ein plausibles Muster.

Für den Tagestourismus zeigt sich unter der Woche ein ähnliches Bild – mit einigen Besonderheiten: Freitage haben hier z. B unter den Wochentagen oft den höchsten überdurchschnittlichen Anteil. Für Samstage kann im Mittel oft kein überdurchschnittlicher Anteil beobachtet werden. Insgesamt ist der Verlauf plausibel, auch wenn die Aggregation auf durchschnittliche Monatswerte für Hessen nur begrenzte Aussagen erlaubt.

Abbildung 4: Durchschnittlicher Anteil an Tagestouristinnen und -touristen sowie Pendlerinnen und Pendlern in Hessen nach Wochentagen und Monaten (Mobilfunkdaten)

Abbildung 5 zeigt das Muster für Pendlerinnen bzw. Pendler und Tagestouristinnen bzw. Tagestouristen nach Uhrzeit und Monat. Hier betrachtet man die durchschnittliche Anzahl an Pendlerinnen bzw. Pendlern sowie Tagestouristinnen bzw. Tagestouristen pro Stunde und Monat. Es ist – wie beim Wochenrhythmus – ein stabiles Muster über die Monate erkennbar: Beide Verläufe sind mit Blick auf die Uhrzeit sehr dynamisch und weisen einen unterdurchschnittlichen Anteil frühmorgens und nachts sowie einen stark steigenden Anteil morgens und einen schnell fallenden Anteil abends auf. Zudem ist deutlich zu erkennen, dass der Tagestourismus zu einem späteren Zeitpunkt am Tag einsetzt als der Pendlerverkehr. Auch in den späteren Abendstunden bewegt sich ein höherer Anteil an Tagestouristinnen bzw. -touristen als an Pendlerinnen bzw. Pendlern.

Abbildung 5: Durchschnittlicher Anzahl an Tagestouristinnen und Tagestouristen sowie Pendlerinnen und Pendlern (aus Mobilfunkdaten) in Hessen nach Uhrzeit und Monaten (in Prozent des Gesamtmittelwertes)

Aus den Kurvenverläufen in den Abbildungen 4 und 5 kann nicht das Größenverhältnis des Tagestourismus zu den Pendlerinnen bzw. Pendlern miteinander verglichen und beurteilt werden, sondern nur das jeweilige Muster des Verlaufs der Kurven. Alle Verläufe für Tagestouristinnen bzw. Tagestouristen und Pendlerinnen bzw. Pendler sowohl nach Wochentagen als auch nach Stunden sind plausibel. Insbesondere der niedrige Anteil für Pendlerinnen bzw. Pendler an den Wochenendtagen (Abbildung 4) und der versetzte zeitliche Verlauf für den Tagestourismus in Abbildung 5: Die Kurve ist im Vergleich zu den Pendlerinnen und Pendlern nach rechts verschoben.

Abbildung 6 hingegen erlaubt einen Größenvergleich zwischen der Anzahl pendelnder Personen nach anonymen Daten aus einem Mobilfunknetzwerk und der Summe einpendelnder sozialversicherungspflichtig beschäftigter Personen (Bundesagentur für Arbeit 2020): Über 75 Prozent der Pendlerinnen bzw. Pendler (sozialversicherungspflichtig beschäftigte Einpendlerinnen bzw. Einpendler an einem Stichtag) können über Daten aus einem Mobilfunknetzwerk abgebildet werden.

Allerdings zeigt Abbildung 6 auch die große Streuung dieses Anteils über die hessischen Städte und Gemeinden, insbesondere bei Städten mit einem höheren Anteil an Einpendelnden (angedeutet durch die Größe der Kreise). Zu beachten ist, dass hier eine Stichtagsgröße (sozialversicherungspflichtig beschäftigte Pendlerinnen bzw. Pendler, Bundesagentur für Arbeit 2020) mit einem Durchschnittswert (durchschnittliche tägliche Anzahl Pendlerinnen bzw. Pendler) im Zeitraum Juli 2019 bis März 2020 verglichen wird. Für diesen Vergleich mit einer Bevölkerungsgröße müssen Ergebnisse auf Grundlage von anonymen Daten aus einem Mobilfunknetzwerk eines Anbieters hochgerechnet werden. Dies ist ein weiterer Grund für mögliche Abweichungen.

Abbildung 6: Durchschnittliche Anzahl an Pendlerinnen und Pendlern (erfasst über Mobilfunk) als Anteil an den sozialversicherungspflichtig beschäftigten Pendlerinnen und Pendlern in hessischen Städten und Gemeinden Juli 2019 bis März 2020 bzw. am Stichtag 30. Juni 2019

Schlussfolgerungen und Ausblick

Durch die hohe räumliche und persönliche Verbreitung von Handys sind anonyme Daten aus Mobilfunknetzwerken grundsätzlich eine sehr vielversprechende Datenquelle für die amtliche Statistik. Die Ergebnisse dieses Pilotprojektes zeigen jedoch: Ursachen für widersprüchliche oder unplausible Ergebnisse können aufgrund des derzeit eingeschränkten Datenzugangs kaum untersucht werden. Aktuelle rechtliche und technische Bedingungen erlauben keine aussagekräftigen oder belastbaren Ergebnisse.

Wie könnte man Mobilfunkdaten also in der amtlichen Statistik nutzen? Für alle amtlichen Statistiken gibt es spezifische Rechtsgrundlagen, die der amtlichen Statistik den umfassenden Zugang zu Datenquellen zum Zweck der Statistikerstellung ermöglicht. Für einen sinnvollen Einsatz in der Statistikproduktion benötigt die amtliche Statistik daher einen gesetzlich geregelten Zugang zu Mobilfunkdaten.

Quellen und Literaturverweise

Vincent D. Blondel, Adeline Decuyper und Gautier Krings (2015): A survey of results on mobile phone datasets analysis. EPJ Data Science (4)10: 1-55. https://doi.org/10.1140/epjds/s13688-015-0046-0.

Joshua Blumenstock, Gabriel Cadamuro und Robert On (2015): Predicting poverty and wealth from mobile phone metadata. Science (350)6264: 1073-1076. https://doi.org/10.1126/science.aac4420.

Bundesagentur für Arbeit – Statistik (2020): Gemeindedaten der sozialversicherungspflichtig Beschäftigten nach Wohn- und Arbeitsort. Deutschland, Länder, Regierungsbezirke, Kreise und Gemeinden. Nürnberg: Bundesagentur für Arbeit. Online verfügbar unter https://statistik.arbeitsagentur.de/Statistikdaten/Detail/201912/iiia6/beschaeftigung-sozbe-gemband/gemband-dlk-0-201906-zip.zip

Bundesnetzagentur (2020): Tätigkeitsbericht Telekommunikation 2018/2019. Bonn: Bundesnetzagentur für Elektrizität, Gas, Telekommunikation, Post und Eisenbahnen. Online verfügbar unter https://www.bundesnetzagentur.de/SharedDocs/Mediathek/Taetigkeitsberichte/2019/TK_20182019.pdf

Guanghua Chi, Fengyang Li, Guangqing Chi und Joshua Blumenstock (2020): A general approach to detecting migration events in digital trace data. PLOS ONE (15)10: e0239408. https://doi.org/10.1371/journal.pone.0239408.

Pierre Deville, Catherine Linard, Samuel Martin, Marius Gilbert, Forrest R. Stevens, Andrea E Gaughan, Vincent D. Blondel und Andrew J. Tatem (2014): Dynamic population mapping using mobile phone data. Proceedings of the National Academy of Sciences (111)45: 15888-15893. https://doi.org/10.1073/pnas.1408439111.

Rex W. Douglass, David A. Meyer, Megha Ram, David Rideout, Dongjin Song (2015): High resolution population estimates from telecommunications data. EPJ Data Science (4)4: 1-13. https://doi.org/10.1140/epjds/s13688-015-0040-6.

Eurostat (2014): Feasibility study on the use of mobile positioning data for tourism statistics: consolidated report. Luxemburg: Publications Office.

Eurostat (2017): Tourism statistics: early adopters of big data? Luxemburg: Publications Office of the European Union. https://doi.org/10.2785/762729.

GSM Association (2020): The Mobile Economy 2020. London: GSMA.

Hessisches Statistisches Landesamt (2020): Statistische Berichte. Gäste und Übernachtungen im hessischen Tourismus im Dezember 2019. Kennziffer G IV1-m12/2019. Wiesbaden: Hessisches Statistisches Landesamt. Online Verfügbar unter https://www.statistischebibliothek.de/mir/receive/HEHeft_mods_00010318

International Telecommunication Union (2018): Measuring the Information Society Report 2018. Genf: International Telecommunication Union.

Edwin de Jonge, Merijn van Pelt und Marko (2012): Time patterns, geospatial clustering and mobility statisticsbased on mobile phone network data. Discussion Paper 201214. Statistics Netherlands: Den Haag

Till Koebe (2020): Betterc overage, better outcomes? Mapping mobile network data to official statistics using satellite imagery and radio propagation modelling. PLoSONE 15(11): e0241981. https://doi.org/10.1371/journal.pone.0241981.

Xin Lu, Linus Bengtsson, und Petter Holme (2012): Predictability of population displacement after the 2010 Haiti earthquake. Proceedings of the National Academy of Sciences (109)29: 11576-11581. https://doi.org/10.1073/pnas.1203882109.

Sveta Milusheva (2020): Managing the spread of disease with mobile phone data. Journal of Development Economics (147): 102559. https://doi.org/10.1016/j.jdeveco.2020.102559.

John R.B. Palmer, Thomas J. Espenshade, Frederic Bartumeus Chang Y. Chung, Necati Ercan Ozgencil und Kathleen Li (2013): New Approaches to Human Mobility: Using Mobile Phones for Demographic Research. Demography (50)3: 1105–28. https://doi.org/10.1007/s13524-012-0175-z.

Carlo Ratti, Dennis Frenchman, Riccardo Maria Pulselli und Sarah Williams (2006): Mobile Landscapes: Using Location Data from Cell Phones for Urban Analysis. Environment and Planning B: Planning and Design (33)5: 727-748. https://doi.org/10.1068/b32047.

Julian Reif und Dirk Schmücker (2020): Exploring new ways of visitor tracking using big data sources: Opportunities and limits of passive mobile data for tourism. Journal of Destination Marketing & Management (18): 100481. https://doi.org/10.1016/j.jdmm.2020.100481.

Erki Saluveer, Janika Raun, Margus Tiru, Laura Altin, Jaanus Kroon, Tarass Snitsarenko, Anto Aasa und Siiri Silm (2020): Methodological framework for producing national tourism statistics from mobile positioning data. Annals of Tourism Research (81): 102895. https://doi.org/10.1016/j.annals.2020.102895.

Frank Schlosser, Benjamin F. Maier, Olivia Jack, David Hinrichs, Adrian Zachariae und Dirk Brockmann (2020): COVID-19 lockdown induces disease-mitigating structural changes in mobility networks. Proceedings of the National Academy of Sciences (117)52: 32883-32890. https://doi.org/10.1073/pnas.2012326117.

Timo Schmid, Fabian Bruckschen, Nicola Salvati und Till Zbiranski (2017): Constructing sociodemographic indicators for national statistical institutes by using mobile phone data: estimating literacy rates in Senegal. Journal of the Royal Statistical Society: Series A (Statistics in Society) (180)4: 1163-1190. https://doi.org/10.1111/rssa.12305.

Alexander Schmidt und Tobias Männel (2017): Potenzialanalyse zur Mobilfunkdatennutzung in der Verkehrsplanung. Stuttgart: Fraunhofer IAO.

Statistics New Zealand (2012): Using cellphone data to measure population movements: experimental analysis following the 22 February 2011 Christchurch earthquake. Wellington: Statistics New Zealand.

Statistisches Bundesamt (2019): Digitale Agenda des Statistischen Bundesamtes. Wiesbaden: Statistisches Bundesamt. Online verfügbar unter https://www.destatis.de/DE/Service/OpenData/Publikationen/digitale-agenda.pdf?__blob=publicationFile

Statistisches Bundesamt (2020a): Wirtschaftsrechnungen. Laufende Wirtschaftsrechnungen. Ausstattung privater Haushalte mit ausgewählten Gebrauchsgütern. Fachserie 15 Reihe 2. Wiesbaden: Statistisches Bundesamt. Online verfügbar unter https://www.destatis.de/DE/Themen/Gesellschaft-Umwelt/Einkommen-Konsum-Lebensbedingungen/Ausstattung-Gebrauchsgueter/Publikationen/Downloads-Ausstattung/ausstattung-privater-haushalte-2150200197004.pdf

Statistisches Bundesamt (2020b): Qualitätsbericht. Monatserhebung im Tourismus. Wiesbaden: Statistisches Bundesamt. Online verfügbar unter https://www.destatis.de/DE/Methoden/Qualitaet/Qualitaetsberichte/Gastgewerbe-Tourismus/tourismus-monatserhebung.html

Michele Tizzoni, Paolo Bajardi, Adeline Decuyper, Guillaume Kon Kam King, Christian M. Schneider, Vincent Blondel, Zbigniew Smoreda, Marta C González, Vittoria Colizza (2014): On the use of human mobility proxies for modeling epidemics. PLoS Computational Biology (10)7: e1003716. https://doi.org/10.1371/journal.pcbi.1003716.

Jameson L. Toole, Yu-Ru Lin, Erich Muehlegger, Daniel Shoag, Marta C. Gonzalez und David Lazer (2015): Tracking employment shocks using mobile phone data. Journal of The Royal Society Interface (12)107: 20150185. https://doi.org/10.1098/rsif.2015.0185.

UN Global Working Group on Big Data for Official Statistics (2019): Handbook on the Use of Mobile Phone Data for Official Statistics. New York: UN Statistics Division.

Amy Wesolowski, Nathan Eagle, Andrew J. Tatem, David L. Smith, Abdisalan M. Noor, Robert W. Snow, Caroline O. Buckee (2012): Quantifying the Impact of Human Mobility on Malaria. Science (338)6104: 267-270. https://doi.org/10.1126/science.1223467.

Amy Wesolowski, Caroline O. Buckee, Kenth Engø-Monsen, C. Jessica E. Metcalf (2016): Connecting Mobility to Infectious Diseases: The Promise and Limits of Mobile Phone Data. Journal of Infectious Diseases (214)S4: S414-S420. https://doi.org/10.1093/infdis/jiw273.

(alle Links Stand: 4. Februar 2021)

Weiterführende Informationen

https://ec.europa.eu/eurostat/cros/content/essnet-big-data-1_en

https://ec.europa.eu/eurostat/cros/content/essnet-big-data-0_en

https://unstats.un.org/bigdata/task-teams/mobile-phone/index.cshtml

https://statistik.hessen.de/zahlen-fakten/experimentelle-statistik

https://www.destatis.de/DE/Service/EXDAT/Datensaetze/mobilitaetsindikatoren-mobilfunkdaten.html

https://research.cbs.nl/dtp/EN/index.html

https://www.covid-19-mobility.org/

https://www.google.com/covid19/mobility/

https://covid19.apple.com/mobility

(alle Links: Stand 04.02.2021)

Beitrag drucken

  1. Siehe das „Covid-19 Mobility Project“ des Robert Koch Instituts zusammen mit der Humboldt Universität Berlin (https://www.covid-19-mobility.org) oder die „Mobilitätsberichte zur Corona-Krise“ von Google (https://www.google.com/covid19/mobility/).
  2. Siehe dazu auch das von der EU geförderte Forschungsprojekt zu „mobile network data“ unter https://ec.europa.eu/eurostat/cros/content/WPI_Mobile_networks_data_en.
  3. Siehe z. B. die Seiten https://statistik.hessen.de/zahlen-fakten/experimentelle-statistik/anonymisierte-daten-aus-mobilfunknetzwerken des HSLs, https://research.cbs.nl/dtp/EN/index.html des Statistischen Amtes der Niederlanden oder die Seite https://www.destatis.de/DE/Service/EXDAT/Datensaetze/mobilitaetsindikatoren-mobilfunkdaten.html des Statistischen Bundesamts.
  4. Der Begriff einer „Mobilfunkzelle“ (oder mehrerer zusammengefasster „Mobilfunkzellen“) beschreibt nur sehr vereinfachend die Mobilfunknetzwerklandschaft. Dementsprechend ist auch die Einteilung in sich nicht überschneidende geographische Gebiete mit Fehlern behaftet. Eine genaue geographische Positionsbestimmung eines Mobilfunkgerätes im Netzwerk ist sehr aufwändig. Als Näherung der Position des mobilen Gerätes wird in vielen Anwendungen die Position der Sendeanlage verwendet, mit der ein Gerät zum jeweiligen Zeitpunkt verbunden ist (Koebe 2020).
  5. Analog dazu ließen sich auch „Abreisen“ festlegen. Diese Kategorie ist weniger für eine Tourismusstatistik von Interesse als zur Evaluation der Datenquelle. Während eine Gästeankunft eine für die Beherbergungsstatistik relevante Gästeübernachtung beinhaltet (und entsprechend in der Summe der Gästeübernachtungen pro Zeit- und geographischer Einheit berücksichtigt werden muss), ist das bei der Gästeabreise nicht der Fall.
  6. „Tagestourismus“ kann auch innerhalb einer Stadt oder Gemeinde stattfinden, wenn die räumlichen Gebiete, die für die Signale im Mobilfunknetzwerk erfasst werden, so klein werden, dass innerhalb einer Gemeinde oder Stadt Wechsel zwischen diesen Gebieten erfasst werden können.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.