Daten im Überfluss sind gleichzeitig Fluch und Segen unserer Zeit. Mit dem Zugmonitor hat die Süddeutsche Zeitung ein besonders anschauliches Projekt initiiert, das die Möglichkeiten und den Nutzen von „Big Data“ aufzeigt. eoda erklärt in einem Screecast, wie man die Daten mit Hilfe R in Echtzeit für Excel-Nutzer aufbereiten kann.
Beim Zugmonitor wird aus den offiziellen Angaben der Bahn eine Live-Karte zu Verspätungen im Fernverkehr dargestellt. Zusätzlich werden die Rohdaten per API von OpenDataCity zur Verfügung gestellt. Dabei können beträchtliche Datenmengen zusammen kommen, denn pro Tag kann man hier die Daten für ca. 1000 Zugeinfahrten abfragen. Die Analyse dieser Rohdaten ist ein schönes Beispiel für „Business Analytics“. Man kann auf Basis dieser Daten verschiedenen Fragestellungen nachgehen:
- Welche Muster gibt es in den Verspätungen?
- Welche Häufungen gibt es in den Ursachen? Wann und auf welchen Strecken?
- Wie entwickeln sich die Verspätungen für Zeiträume, Orte oder Züge?
- …
eoda setzt bei Datenanalyse auf R, die zur Zeit vermutlich mächtigste Sprache zur umfassenden Datenanalyse, die gerade rapide an Verbreitung zunimmt. Dieser Trend wird aktuell dadurch untermauert, dass SAP scheinbar plant, seine „Predicitive Analytic Lösungen“ für R zu öffnen.
Hier entlang.