Konzeption einer Data-Science-Infrastruktur bei der AOK Baden-Württemberg

Vorteil

Schaffung der optimalen Rahmenbedingungen für das Thema Data Science durch eine performante, skalierbare und gleichzeitig sichere IT-Infrastruktur.

Herausforderung

Aufbau einer zentralen Infrastruktur, welche den heterogenen Anforderungen unterschiedlicher Nutzertypen gleichermaßen gerecht wird.

Toolset

Entwicklung eines hybriden Stacks aus Open-Source- und Enterprise-Lösungen rund um die bestehenden Komponenten wie der SAP HANA DB, R und Tableau.

Ziel

Die AOK Baden-Württemberg möchte das Thema Data Science im Unternehmen aktiv vorantreiben. Der zentrale Baustein dieser Initiative ist der Aufbau einer IT-Infrastruktur, die auf die hohe Entwicklungsgeschwindigkeit und die agile Herangehensweise im Bereich Data Science ausgerichtet ist und gleichzeitig den hohen Anforderungen eines produktiven IT-Systems entspricht.

Logo AOK BW

Herausforderung

Die ITSCare als AOK-Tochter und Spezialist für IT-Services im Gesundheitsmarkt hat die Data-Science-Experten von eoda mit der Konzeption einer professionellen IT-Infrastruktur für die AOK Baden-Württemberg beauftragt.

Um ein optimal passendes Infrastruktur- und Implementierungskonzept zu entwickeln, hat eoda im Rahmen eines auf die AOK Baden-Württemberg zugeschnittenen Assessments die Data Science- und IT-Verantwortlichen auf Kundenseite zusammengebracht. Ziel des Assessments war es, den Reifegrad der bestehenden IT-Infrastruktur und die zentralen Data und User Stories zu ermitteln. Die Data Stories verdeutlichen den Weg von der Datenquelle bis zur Datenausgabe an den betreffenden Stakeholder und die damit verbundenen Anforderungen an die Infrastruktur.

Aufgrund der Vielzahl unterschiedlicher Data Stories und Nutzertypen lag die zentrale Herausforderung der AOK Baden-Württemberg in der Schaffung einer zentralen Infrastrukturlösung, welche die sehr heterogenen Anforderungen optimal berücksichtigt.

Im Rahmen des Assessments wurden folgende Potenzialfaktoren der bestehenden IT-Infrastruktur in Bezug auf die Anforderungen im Data-Science-Kontext identifiziert:

  • Ausbau des Professionalisierungsgrads
  • Verbesserung des kollaborativen Arbeitens und der Reproduzierbarkeit
  • Steigerung der Skalierbarkeit
  • Modularer Aufbau mit verschieden Ausbaustufen für zukünftige Herausforderungen (Cloud-readiness etc.)
  • Integration der Kernkomponenten aus der bereits bestehenden Data Science Landschaft

Lösung

Die bestehende IT-Infrastruktur rund um die SAP HANA DB, R / Posit (vorher RStudio) und Tableau bietet den Data Scientists bereits zahlreiche Tools, um auch anspruchsvolle Modelle umzusetzen. Mit einem zentral verankerten Konzept und der damit verbundenen Professionalisierung der IT-Infrastruktur kann aber darüber hinaus für die Data Scientists ein technisches Umfeld geschaffen werden, welches sie in ihrer Arbeit entscheidend unterstützt.

Auf Basis dieser Erkenntnisse haben die Expertinnen und Experten von eoda ein Realisierungskonzept für die AOK Baden-Württemberg entwickelt, welches folgende Handlungsfelder umfasst:

Handlungsfelder für den Aufbau der Data-Science-Infrastruktur

Integration & Tools

IDEs für R & Python, Einsatz von Docker etc.

Datenanbindung

Performanter Datenzugriff etc.

Rechte & Installationen

Zugriffsrechte, Paketinstallationen etc.

Reporting & Deployment

Reports, Dashboards, Apps, REST APIs etc.

CI / CD DevOps/MLOps

Versionsverwaltung von Code und Daten etc.

Hardware & Ressourcen

Skalierbarkeit, GPU-Support, Leistung etc.

Security & IT

On-premise, AD-Anbindung, Cloud readiness etc.

Das empfohlene Realisierungskonzept zeichnet sich durch einen hybriden Stack aus Open-Source- und Enterprise-Lösungen aus. Dieser vereint die geforderte Flexibilität mit einer guten Wartbarkeit. Hervorzuheben ist die Verankerung einer Forschungsumgebung für das unkomplizierte und risikofreie Austesten neuer Pakete und Funktionen durch die Data Scientists.

Das Realisierungskonzept des eoda | analytic infrastructure consultings umfasst auch einen detaillierten Plan zur Umsetzung der konzipierten Infrastruktur und ihrer Komponenten.

Übersicht über den Aufbau der Dateninfrastruktur für die AOK BW

Ergebnis

Mit der Professionalisierung ihrer IT-Infrastruktur hebt die AOK Baden-Württemberg die Rahmenbedingungen für das Thema Data Science auf ein neues Level. Das Realisierungskonzept der eoda ist das Fundament für eine performante, skalierbare und gleichzeitig sichere IT-Infrastruktur, die perfekt ausgelegt ist, auf den produktiven Einsatz von Data Science im Unternehmen.

Erfahren Sie im zweiten Teil der Case Study mehr über die Implementierung der Data-Science-Infrastruktur.

Sehr gerne realisieren wir auch die passende Dateninfrastruktur für Ihr Unternehmen.