Open Source feiert seinen 20. Geburtstag: Im Februar 1998 – im Herzen des Silicon Valley – gründeten Aktivisten rund um die beiden Initiatoren Bruce Perens und Eric S. Raymond die Open Source Initiative. Die Initiative und die damit verbundene Definition von Open Source sind der Ausgangspunkt für die Erfolgsgeschichte quelloffener Software. Eine Erfolgsgeschichte, die auch vor starken Kritikern nicht Halt gemacht hat.
Open Source auf dem Vormarsch
Keine Lizenzgebühren, keine Nutzungseinschränkungen: Open Source wollte so gar nicht in das Geschäftsmodell der etablierten Softwareanbieter passen. Der damalige Microsoft-Chef Ballmer bezeichnete 2001 noch das Open-Source-Betriebssystem Linux als „ein Krebsgeschwür“. Entnimmt man diesem Statement die negative Konnotation, bleibt eine zentrale Parallele zur Open-Source-Bewegung: Sie breitet sich stark aus. Immer mehr Unternehmen haben erfolgreich kommerzielle Dienstleistungen im Umfeld freier Softwarelösungen platziert. Open Source wurde zur treibenden Kraft ganzer Bereiche und Branchen.
Wieso Data Science so stark von Open Source profitiert
Data Science ist ein Themenbereich, der in besonderem Maße von einem starken Open-Source-Toolset profitiert. Freie Skriptsprachen wie R, Python und Julia, Big-Data-Frameworks wie Spark und Hadoop oder die Programmbibliothek TensorFlow zum Deep Learning: Es hat sich ein großes Ökosystem an quelloffenen Softwarelösungen für die Anforderungen im Umfeld von Big Data, Künstlicher Intelligenz und Machine Learning entwickelt.
Die Gründe dafür sind ebenso vielfältig wie plausibel:
- Starke Community und schnelle Entwicklungszyklen: Große Datenmengen, individuelle Use Cases und heterogene IT-Landschaften – die Anforderungen an ein Data-Science-Toolset sind groß und unterliegen ständigen Veränderungen. Open Source kann hier Schritt halten. Die große Community ist der Garant für schnelle Entwicklungszyklen – sie ist nicht nur User, sondern auch Entwickler. Open-Source-Anwendungen erreichen im Vergleich zu proprietärer Software oftmals deutlich schneller eine hohe Qualität.
- Transparenz und Nachvollziehbarkeit: Um Daten nachhaltig als Entscheidungsgrundlage zu etablieren, braucht es vor allem gesellschaftliche Akzeptanz und Vertrauen. Offen liegender Quellcode kann hier helfen, ein tiefergehendes Verständnis von den eingesetzten Algorithmen zu bekommen und die Reproduzierbarkeit zu erhöhen. Kurzum: Es muss den von algorithmischer Entscheidungsfindung Betroffenen möglich sein, das Zustandekommen einer Entscheidung nachvollziehen zu können. Alles zusammen entscheidende Gründe, wieso Open Source auch im Unternehmenskontext intransparente Blackbox-Lösungen immer mehr verdrängt.
- Optimaler Einstieg: In vielen Unternehmen ist die Einführung von Analytik ein Bottom-up-Prozess. Eine lizenzkostenfreie Skriptsprache wie R erlaubt einen unkomplizierten und risikoarmen Einstieg. Unterstützt durch den breit aufgestellten Community-Support gelingen schnelle Erfolgserlebnisse. Die Begeisterung für Data Science wird entfacht, Open Source bleibt der Begleiter auf der Entdeckungsreise durch die Daten.
Raus aus der Nische, rein in die Unternehmen
Es gibt zahlreiche Indikatoren dafür, dass Open Source speziell im Analysekontext endgültig im Businessalltag angekommen ist. Oliver Bracht, Geschäftsführer des Data Science Spezialisten eoda, sieht eine positive Entwicklung: „Wir bemerken seit einigen Jahren, dass die Akzeptanz für Open-Source-Software wie R, Python oder Spark bei Unternehmen aller Branchen kontinuierlich wächst. Selbst im sensiblen Finance-Bereich ist dieser Wandel feststellbar. Mit der stetigen Professionalisierung der Open-Source-Tools wird sich diese Entwicklung weiter fortsetzen“.
Zu einer der treibenden Kräfte dieser Entwicklung zählt mittlerweile übrigens auch Microsoft. Der Software-Gigant hat seine Meinung geändert und engagiert sich zum Beispiel aktiv für die Weiterentwicklung von R.