Konzeption einer Data-Science-Infrastruktur bei der AOK Baden-Württemberg
Vorteil
Schaffung der optimalen Rahmenbedingungen für das Thema Data Science durch eine performante, skalierbare und gleichzeitig sichere IT-Infrastruktur.
Herausforderung
Aufbau einer zentralen Infrastruktur, welche den heterogenen Anforderungen unterschiedlicher Nutzertypen gleichermaßen gerecht wird.
Toolset
Entwicklung eines hybriden Stacks aus Open-Source- und Enterprise-Lösungen rund um die bestehenden Komponenten wie der SAP HANA DB, R und Tableau.
Ziel
Die AOK Baden-Württemberg möchte das Thema Data Science im Unternehmen aktiv vorantreiben. Der zentrale Baustein dieser Initiative ist der Aufbau einer IT-Infrastruktur, die auf die hohe Entwicklungsgeschwindigkeit und die agile Herangehensweise im Bereich Data Science ausgerichtet ist und gleichzeitig den hohen Anforderungen eines produktiven IT-Systems entspricht.
Herausforderung
Die ITSCare als AOK-Tochter und Spezialist für IT-Services im Gesundheitsmarkt hat die Data-Science-Experten von eoda mit der Konzeption einer professionellen IT-Infrastruktur für die AOK Baden-Württemberg beauftragt.
Um ein optimal passendes Infrastruktur- und Implementierungskonzept zu entwickeln, hat eoda im Rahmen eines auf die AOK Baden-Württemberg zugeschnittenen Assessments die Data Science- und IT-Verantwortlichen auf Kundenseite zusammengebracht. Ziel des Assessments war es, den Reifegrad der bestehenden IT-Infrastruktur und die zentralen Data und User Stories zu ermitteln. Die Data Stories verdeutlichen den Weg von der Datenquelle bis zur Datenausgabe an den betreffenden Stakeholder und die damit verbundenen Anforderungen an die Infrastruktur.
Aufgrund der Vielzahl unterschiedlicher Data Stories und Nutzertypen lag die zentrale Herausforderung der AOK Baden-Württemberg in der Schaffung einer zentralen Infrastrukturlösung, welche die sehr heterogenen Anforderungen optimal berücksichtigt.
Im Rahmen des Assessments wurden folgende Potenzialfaktoren der bestehenden IT-Infrastruktur in Bezug auf die Anforderungen im Data-Science-Kontext identifiziert:
- Ausbau des Professionalisierungsgrads
- Verbesserung des kollaborativen Arbeitens und der Reproduzierbarkeit
- Steigerung der Skalierbarkeit
- Modularer Aufbau mit verschieden Ausbaustufen für zukünftige Herausforderungen (Cloud-readiness etc.)
- Integration der Kernkomponenten aus der bereits bestehenden Data Science Landschaft
Lösung
Die bestehende IT-Infrastruktur rund um die SAP HANA DB, R / Posit (vorher RStudio) und Tableau bietet den Data Scientists bereits zahlreiche Tools, um auch anspruchsvolle Modelle umzusetzen. Mit einem zentral verankerten Konzept und der damit verbundenen Professionalisierung der IT-Infrastruktur kann aber darüber hinaus für die Data Scientists ein technisches Umfeld geschaffen werden, welches sie in ihrer Arbeit entscheidend unterstützt.
Auf Basis dieser Erkenntnisse haben die Expertinnen und Experten von eoda ein Realisierungskonzept für die AOK Baden-Württemberg entwickelt, welches folgende Handlungsfelder umfasst:
Handlungsfelder für den Aufbau der Data-Science-Infrastruktur
Integration & Tools
IDEs für R & Python, Einsatz von Docker etc.
Datenanbindung
Performanter Datenzugriff etc.
Rechte & Installationen
Zugriffsrechte, Paketinstallationen etc.
Reporting & Deployment
Reports, Dashboards, Apps, REST APIs etc.
CI / CD DevOps/MLOps
Versionsverwaltung von Code und Daten etc.
Hardware & Ressourcen
Skalierbarkeit, GPU-Support, Leistung etc.
Security & IT
On-premise, AD-Anbindung, Cloud readiness etc.
Das empfohlene Realisierungskonzept zeichnet sich durch einen hybriden Stack aus Open-Source- und Enterprise-Lösungen aus. Dieser vereint die geforderte Flexibilität mit einer guten Wartbarkeit. Hervorzuheben ist die Verankerung einer Forschungsumgebung für das unkomplizierte und risikofreie Austesten neuer Pakete und Funktionen durch die Data Scientists.
Das Realisierungskonzept des eoda | analytic infrastructure consultings umfasst auch einen detaillierten Plan zur Umsetzung der konzipierten Infrastruktur und ihrer Komponenten.
Ergebnis
Mit der Professionalisierung ihrer IT-Infrastruktur hebt die AOK Baden-Württemberg die Rahmenbedingungen für das Thema Data Science auf ein neues Level. Das Realisierungskonzept der eoda ist das Fundament für eine performante, skalierbare und gleichzeitig sichere IT-Infrastruktur, die perfekt ausgelegt ist, auf den produktiven Einsatz von Data Science im Unternehmen.
Erfahren Sie im zweiten Teil der Case Study mehr über die Implementierung der Data-Science-Infrastruktur.
Sehr gerne realisieren wir auch die passende Dateninfrastruktur für Ihr Unternehmen.
Mehr zum Thema Dateninfrastruktur
Unser Angebot: Konzeption, Implementierung und Betrieb
Wir realisieren Dateninfrastrukturen für den professionellen Einsatz von Data Science und KI in Ihrem Unternehmen - performant, skalierbar, sicher.
Case Study: Implementierung der Data-Science-Infrastruktur bei der AOK Baden-Württemberg
Wie ging es nach der Konzeption weiter? Erfahren Sie mehr über die Implementierung der Data-Science-Infrastruktur.
Case Study: Aufbau einer Analyseumgebung für Konzernstrukturen
Wir haben für die REWE Group eine leistungsfähige Analyseumgebung rund um den produktiven Einsatz der Data-Science-Sprache R aufgebaut.
Case Study: Aufbau einer zentralisierten Dateninfrastruktur
Für Covesto haben wir eine reproduzierbare und zentralisierte Entwicklungsumgebung für R und Python geschaffen, die hilft, Compliance-Richtlinien zu erfüllen und gleichzeitig die Zusammenarbeit zu verbessern.