Willkommen zum eoda Data Science Adventskalender
Für viele ist die Weihnachtszeit die Zeit der guten Taten. Gute Taten stehen auch im Mittelpunkt unseres Data Science Adventskalenders. Wir nehmen Sie mit auf eine Reise durch 24 wunderbare Beispiele, in denen Data Science geholfen hat, unsere Welt ein Stückchen besser zu machen. Denn Data Science kann nicht nur im Unternehmensalltag helfen, Entscheidungen und Prozesse zu verbessern, sondern ist auch für gemeinnützige Organisationen und die Wissenschaft von immer größerer Bedeutung.
Wir ergänzen an dieser Stelle täglich eine gute Data-Science-Tat und halten Sie über unsere Social-Media-Kanäle auf dem Laufenden.
Wir wünschen Ihnen und Ihren Familien eine besinnliche und friedliche Adventszeit und inspirierende Momente mit unserem Data Science Adventskalender.
#1 Operation Smile
Jedes 500. bis 750. Kind kommt weltweit mit einer gespaltenen Lippe auf die Welt. Während in Deutschland diese Fehlbildung früh medizinisch korrigiert wird, leiden in anderen Ländern Kinder mit gespaltener Lippe unter massiven Hänseleien anderer Kinder und sozialer Verachtung. Operation Smile hilft in 28 Ländern Kindern durch chirurgische Eingriffe ein normales Leben zu führen. Ein Algorithmus zur Gesichtsmodellierung unterstützt dabei die Mediziner. Der Algorithmus wertet Bilddaten aus und gibt Empfehlungen für die Modellierung der Gesichtszüge, um für die Kinder das optimale OP-Ergebnis zu erzielen. Dadurch kann Operation Smile seine vorhandenen Ressourcen noch besser einsetzen und mehr Kindern helfen. Mehr.
#2 Künstliche Intelligenz rettet Bäume
Umweltschutz und Künstliche Intelligenz sind aktuell zwei der Themen, die den gesellschaftlichen Diskurs bestimmen. Aber funktionieren sie auch gemeinsam? Das deutsche Unternehmen „Vision Impulse“ will es beweisen. Es setzt künstliche neuronale Netzwerke ein, welche selbstständig Muster in Satellitenaufnahmen von Wäldern erkennen. Das Ziel: Automatisiert den Gesundheitszustand von Wäldern über den gesamten Planeten festzustellen. Auch darüber hinaus gibt es noch viele weitere Anwendungsmöglichkeiten um KI im Bereich Umweltschutz erfolgreich einzusetzen. Mehr.
#3 CorrelAid: Data Science for Good
CorrelAid vereint als gemeinnütziger Verein 650 ehrenamtliche Datenanalyst*Innen, die für kleine und große NPOs Data-Science-Projekte durchführen. Dadurch hilft das mehrfach ausgezeichnete CorrelAid Organisationen Wissen aus Daten zu generieren. Dieses Wissen kann genutzt werden, um Prozesse effizienter zu gestalten oder Ressourcen besser zu verteilen. Damit erleichtert CorrelAid die Arbeit der Organisationen und hilft Spendengelder noch besser einzusetzen. Der Verein aus Konstanz setzt sich ebenfalls für die Weiterbildung im Bereich Data Science ein und veranstaltet Workshops sowie Meetups zum Thema. Mehr.
#4 DataKind: Harnessing the power of data science in the service of humanity
Nutze Daten nicht nur um zu entscheiden, welche Art von Film, sondern auch dafür, welche Art von Welt wir in Zukunft sehen wollen. DataKind steht als Organisation für die Bedeutung von Data Science für die Lösung globaler Probleme. DataKind bringt führende Datenanalysten und gemeinnützige Organisationen zusammen, um mit Data Science den Social Impact zu steigern. Das Engagement reicht von Impuls-Workshops bis hin zu langfristigen Analyseprojekten. Bildung, Sicherheit, Nachhaltigkeit: Ausgehend von mehreren Standorten weltweit kümmert sich DataKind um die zentralen Fragen unserer Zukunft. Mehr.
#5 Data Science for Social Good: Data Scientists und NGOs zusammenbringen
Sozialen Organisationen den Sinn und Nutzen von Data Science näherbringen und gleichzeitig Data Scientists verdeutlichen, dass sie ihre Fähigkeiten für das gesellschaftliche Wohl einbringen können: Das ist die Mission von Data Science for Social Good. Inspiriert von DataKind hat sich die Organisation 2015 in Berlin gegründet. Ein Erfolgsbeispiel: In einem sogenannten Data Dive hat Data Science for Social Good eine Wirkungsanalyse für Jambo Bukoba gemacht. Dieser Verein will das Wohlergehen der Kinder in Afrika mit Sport fördern. Mit Data Science konnten die positiven Auswirkungen dieser Initiative belegt werden. Mehr.
#6 Krebserkrankungen mit KI zuverlässiger erkennen
Wie in Indien gibt es in vielen anderen Ländern der Erde zu wenig Ärzte, um die schiere Masse an Patienten adäquat versorgen zu können. Eine von Microsoft und SRL Diagnostics entwickelte KI-Lösung untersucht automatisiert Bilder von angefertigten Abstrichen und erkennt, wann eine genauere Prüfung durch einen Arzt nötig ist. Durch diesen Vorab-Check können deutlich mehr Patienten untersucht werden, die vorhandenen Ärzte sich auf die kritischen Fälle konzentrieren und notwendige Behandlungen frühzeitiger eingeleitet werden. Die Testphase der Lösung ist angesetzt. Mehr.
#7 Mit KI die Behandlung von Krebspatienten verbessern
Dr. Fruzsina Molnar-Gabor hat sich im Rahmen eines Projekts der Volkswagen Stiftung der Individualisierung und Demokratisierung in der Versorgung von Krebspatienten durch KI angenommen. Konkret geht es zum Beispiel um den Unterschied in der Behandlungsqualität bei Patienten in Universitätskliniken im Vergleich zu Kliniken im ländlichen Raum. Mittels KI kann die Krebstherapie individueller gestaltet werden. So ist die Wahl der Behandlungsstrategie in Zukunft weniger abhängig von subjektiven Einschätzungen der Ärzte, sondern viel mehr von der für ihn auf Datenbasis ermittelten Behandlung mit der größten Heilungschance. Dadurch erhalten alle Patienten die Chance auf die objektiv beste Behandlung ihrer Erkrankung. Mehr.
#8 Mit Deepfake geschichtliche Ereignisse greifbarer machen
Deepfake steht für die KI-gestützte Produktion von Bildern und Videos, die zwar täuschend echt wirken, aber es nicht sind. Diese Fälschungen birgen natürlich Gefahren, wie die Vortäuschung falscher Tatsachen. Tatsächlich gibt es aber auch positive Einsatzszenarien für die Deepfake-Technologie. Neben der deutlichen Vereinfachung bei der Synchronisierung und Übersetzung von bestehenden Videos kann Deepfake vor allem helfen, geschichtliche Ereignisse für kommende Generationen greifbarer zu machen. So setzt zum Beispiel das Holocaust Museum and Education Center in Illionois auf KI, um Besuchern die Möglichkeit zu geben mit holografisch dargestellten Holocaust-Überlebenden „zu sprechen“. Deepfake liefert so einen beliebig skalierbaren Beitrag gegen das Vergessen. Mehr.
#9 Mit Data Science die Ursachen des Klimawandels bestimmen
Es ist die größte Herausforderung unserer Zeit: Der immer weiter fortschreitende Klimawandel und die damit verbundene Notwendigkeit, Maßnahmen zu ergreifen, die die globale Erwärmung schnellstmöglich eindämmen können. Die Basis dafür ist die Überzeugung der Weltbevölkerung von den verheerenden Auswirkungen ihres Handelns. Bereits 2010 hat ein Forscherteam in der Antarktis mit Data Science die massiven Zusammenhänge zwischen den produzierten Treibhausgasen und der globalen Erwärmung bewiesen und präzise quantifiziert. Die Datenbasis: Zehntausende Jahre alte Eisschichten, die durch Bohrungen an die Oberfläche gebracht werden und ein genaues Bild von der Entwicklung der Erde ermöglichen. Mehr.
#10 John Snow: Daten-Pionier im Kampf gegen Cholera
In den 1830er Jahren erreichte die tödliche Seuche Cholera England und damit auch die Hauptstadt London. Immer wieder brach die Seuche aus und den Medizinern gelang es nicht, der Krankheit endgültig Herr zu werden. Die fälschliche Annahme damals: Cholera verbreitet sich über die Luft. Der Mediziner John Snow zweifelte an dieser Theorie. Um diese Zweifel zu belegen, erfasste Snow alle auftretenden Cholerafälle und trug sie in eine Karte von London ein. Was auffiel: Die Krankheitsfälle umfassten ein recht kleines Stadtgebiet entlang der Broad Street. In dieser Straße befand sich die Wasserpumpe für die Trinkwasserversorgung der Menschen in dieser Gegend. Snow untersuchte das Wasser, fand darin Bakterien und setzte die Pumpe außer Betrieb. Mit Erfolg. Die Epidemie breitete sich nicht weiter aus. Damit ermittelte John Snow 1854 als Erster den richtigen Ursprung von Cholera – auf Basis systematischer Datenerfassung. Mehr.
#11 AlgorithmWatch: Die algorithmische Entscheidungsfindung im Blick
Die algorithmische Entscheidungsfindung ist komplex, aber diese Komplexität darf nicht dazu führen, dass die Technik nicht mehr nachvollziehbar ist. Das ist das Mission Statement von AlgorithmWatch. In diesem Türchen unseres Data-Science-Adventskalenders blicken wir auf eine gemeinnützige Organisation, die es sich zum Ziel gemacht hat, den Nutzen der algorithmische Entscheidungsfindung für das Gemeinwohl zu maximieren. AlgorithmWatch betrachtet das Wirken entwickelter Algorithmen, ordnet es ein und klärt über die Gefahren und Auswirkungen auf. Die wichtigsten Aspekte dabei, sind die Verantwortlichkeit der Schöpfer von ADMI-Prozessen (algoritmic decision making), die Einforderung von Nachvollziehbarkeit und die Schaffung von entsprechenden Regularien und Aufsichtsinstitutionen. Mehr.
#12 Smart City Kopenhagen: Der digitale Marktplatz für Daten
Die dänische Hauptstadt Kopenhagen setzt zur Förderung von Kreativität und Innovationsgeist auf einen digitalen Markplatz. Auf diesen werden Datenmengen zum verkauften Produkt. Data Science ist dadurch nicht mehr nur denen vorbehalten, die selber große Datenmengen sammeln, sondern steht allen zur Verfügung, die das Datenpotenzial erkannt haben und es für sich nutzen müssen. Die Vorteile dabei: Daten müssen nicht für einzelne Projekte neu gesammelt werden, sondern können parallel für verschiedene Use Cases genutzt werden – es bleibt mehr Zeit für die Analyse, statt für die Sammlung der Daten. Durch die zentrale Aggregation wird klarer, welche Informationen überhaupt vorhanden sind und kleine Unternehmen erhalten Datenzugänge, die ihnen eine positive Entwicklung erleichtern können. Kopenhagen erhofft sich dadurch mehr Innovationen und die Identifikation von Problemen im Stadtleben, die bislang vielleicht noch gar nicht bekannt sind, aber mit Daten schneller lokalisiert werden können. Mehr.
#13 Epilepsie: Künstliche Intelligenz prognostiziert Anfälle
Eine schnelle und zuverlässige Prognose des nächsten epileptischen Anfalls gibt den Betroffenen die Möglichkeit Gegenmaßnahmen zu ergreifen und ihre Lebensqualität dadurch deutlich verbessern. Ein Deep-Learning-Algorithmus extrahiert und analysiert räumlich-zeitliche Eigenschaften der Hirnaktivität und kommt dadurch zu einer präzisen Prognose. Trainiert wird das KI-Modell mit Messdaten aus einer Langzeitstudie. Das Studienergebnis: Die KI sagt Anfälle mit einer Genauigkeit von 99,6% voraus. Aktuell arbeiten die Forscher an einer handlichen Hardware mit KI-Chip, damit die Patienten in Zukunft unkompliziert gewarnt werden können. Mehr.
#14 Mit Analysemodellen aus der Formel 1 Säuglinge retten
Die Formel 1 ist Komplexität pur. Ein Rennwagen besteht aus über 20.000 Teilen. Alle zwei Wochen werden über 5.000 Komponenten überarbeitet, um die Leistungsfähigkeit des Wagens stetig zu verbessern. Die Informationen für diese Maßnahmen liefern Analysemodelle basierend auf hunderten von Sensoren am Fahrzeug. Allein 13.000 Parameter geben Auskunft über den „Gesundheitszustand“ des Wagens. Diese Informationen fließen auch in Empfehlungen für Sofortmaßnahmen während eines Rennens. Der ehemalige Managing Director von McLaren Electronics hat die komplexen Analysemodelle aus der Formel 1 auf die IT-Systeme des Birmingham Children`s Hospital übertragen. Hier werden in Echtzeit Daten wie Herzfrequenz und Sauerstoffsättigung des Bluts erfasst und auf Anomalien hin untersucht. Dadurch wird es für die Mediziner einfacher zu erkennen, wann sich wichtige Parameter beginnen zu verändern und präventive Maßnahmen ergriffen werden müssen. Wie bei der Formel 1 ist das System im Sinne einer Augmented Intelligence als Empfehlung zu verstehen. Mehr.
#15 Katastrophenfälle in der U-Bahn? Künstliche Intelligenz hilft
Naturkatastrophen, Stromausfälle oder Brände können in U-Bahnen schwerwiegende Schäden anrichten. Noch gravierender werden die Folgen, wenn das U-Bahnnetz dabei zusammenbricht. An der Widerstandsfähigkeit der technischen Systeme arbeiten deutsche und französische Forscher. Die Zielsetzung: Bahnen, Haltestellen und die weitere technische Infrastruktur nach Störfällen schneller wieder in Kraft setzen. Die Basis dafür ist eine Software-Lösung auf Basis von KI. Das System soll mittels Simulationsrechnungen schnell optimale Umleitungen finden und U-Bahnen automatisch auf sichere Strecken umleiten. Das System bezieht dabei auch die Bauweise von Tunneln und die beim Bau eingesetzten Materialien mit ein. Mehr.
#16 Mit KI Vulkanaktivitäten besser überwachen
Rund 85 von 1.500 aktiven Vulkanen weltweit brechen jedes Jahr aus. Mehr als die Hälfte der aktiven Vulkane wird nicht überwacht – eine Warnung der Bevölkerung findet nicht statt. Grund dafür sind die mitunter hohen Kosten und die schwierige Wartung von bodengestützten Messinstrumenten in vulkanischen Umgebungen. Die TU Berlin und das Deutsche GeoForschungsZentrum in Potsdam setzen deshalb auf KI. Diese soll auf Grundlage Satellitendaten Vulkanaktivitäten auswerten und frühzeitig vor einem Ausbruch warnen. Der Trainingsdatensatz umfasste Bildmaterial von Vulkanausbrüchen aus der jüngeren Vergangenheit. Mit Ausnahme der Seismizität können Signale wie Bodenverformungen oder Gasmissionen mittels Bilddatenanalyse über Satellitenaufnahmen erfasst werden. Die Lösung namens MOUNTS überwacht bereits 17 Vulkane weltweit. Mehr.
#17 Die Nutzung von Astrophysik zur Lösung globaler Probleme
Sie können nicht mit ihren Studienobjekten interagieren und eine Explosion im Labor zur Ermöglichung einer genaueren Untersuchung ist ebenfalls unmöglich: Astrophysiker arbeiten ausschließlich mit Bildern und Videos des Himmels. Sie sind daher die Meister in der Analyse von Bilddaten und bei der Komplexität des untersuchten Systems die Schaffer großartiger mathematischer Modelle auf Basis riesiger Datenmengen. Federico Bianco hat gemeinsam mit ihrem Mann diese Fähigkeiten genutzt, um Probleme auf der Welt zu lösen. Statt Himmelsaufnahmen haben die beiden Bildmaterialien von Städten bei Nacht untersucht. Analog zu astronomischen Lichtern haben sie auf Basis der Beleuchtung der Häuser und Straßen den Energieverbrauch der Städte erfasst und vorhergesagt. Dieses Wissen kann in bedarfsgerechte Stromnetze einfließen. Darüber hinaus haben sie die Luftverschmutzung einzelner Gebäude über die sichtbaren Abgaswolken ermittelt. Deutlich günstiger als mit separaten Sensoren an den Häusern, können so Karten der Luftverschmutzung angefertigt und zielgerichtet Maßnahmen ergriffen werden. Mehr.
#18 Die Natur besser verstehen mit Künstlicher Intelligenz
Wie kommunizieren Individuen miteinander, welche Regeln und Abhängigkeiten bestehen zwischen ihnen? Diese Fragestellungen sind bereits bei uns Menschen schwer zu beantworten. Noch schwerer fällt dies im Tierreich. Der Informatiker Tim Landgraf von der Freien Universität Berlin setzt nun auf KI, um das Sozialverhalten von Tieren besser zu verstehen. Konkret geht es um Fische und deren non-verbale Kommunikation. Das neuartige Forschungsfeld setzt dabei auf den Austausch von Individuen. 3D gedruckte Guppys werden über Magnete verbunden und von einem Roboter gesteuert. Dieser Roboter wird mit einem bestimmten „Charakter“ definiert und den entsprechenden Eigenschaften ausgestattet. So lässt sich die Wirkung des Roboters auf das Verhalten der Fische ermitteln, um somit Charaktereigenschaften und Beziehungen unter den Tieren besser mittels Analytik zu verstehen. Dadurch werden Entscheidungsprozesse ebnfalls deutlich transparenter. Mehr.
#19 Mit Data Science Menschenrechte schützen
KI kann Prozesse erledigen, für die der Mensch nicht schnell genug ist. Neben dem damit verbundenem Imageproblem möglicher Jobverluste durch KI, kann die Technik auch bei guten Anliegen Nutzen stiften. Ein Beispiel: Der Schutz der Menschenrechte. Die Open-Source-Software VFrame setzt auf KI, um Bilder und Videos in Konfliktgebieten im Jemen oder in Syrien zu bewerten. Das Syrian Archive, welches sich auf die Sammlung der Filme aus dem Kriegsgebiet spezialisiert hat, verfügt über mehr als drei Millionen Videos. Eine händische Überprüfung würde Jahre dauern. Der Algorithmus wird daraufhin trainiert, um so bestimmte Gegenstände in den Videos zu identifizieren. Hierzu zählen Objekte, die auf illegale Munition hinweisen. So kann mit KI gezeigt werden, wann und wo chemische Waffen und Streumunitionen zum Einsatz kommen. Auch die Echtheit der Videos kann über die Software bewiesen werden. Mehr.
#20 Dynamic Pricing als Schlüssel zu weniger Lebensmittelausschüssen
Über ein Drittel der Lebensmittel landet im Müll. Abhängig von Vorschriften und dem Konsumverhalten der Kunden müssen Supermärkte tagtäglich noch gute Lebensmittel entsorgen. KI kann Abhilfe schaffen. Algorithmen berechnen den Abverkauf und Lagerbestand und geben den Händlern Empfehlungen hinsichtlich der dynamischen Preisgestaltung. Die KI baut so die Lagerbestände ab und kann mehr Lebensmittel vor der Entsorgung bewahren. Mehr.
#21 Mit Machine Learning den Klimawandel bekämpfen
„Climate Change AI“: So heißt das Experten-Netzwerk, welches sich mit den Einsatzmöglichkeiten von Machine Learning auseinandergesetzt hat und so Unternehmen und Investoren erreichen will. Mit dabei sind zum Beispiel der Pionier im Bereich künstlicher neuronaler Netze Yoshua Bengio und Wissenschaftler des Berlina Klimaforschungsinstituts MCC. Die ermittelten Anknüpfungspunkte für Machine Learning sind dabei vielfältig und reichen von der Emission der Treibhausgase über die Entwicklung besserer Batterien bis hin zur effizienteren Steuerung von Heiz- und Kühlsystemen. Die Initiative wird zurzeit weiter ausgeweitet, um mit noch mehr Aufmerksamkeit Investoren zu finden, die helfen die anvisierten Maßnahmen umzusetzen. Mehr.
#22 Künstliche Intelligenz im Flugzeugbau: Für mehr Sicherheit und Effizienz
Das Deutsche Zentrum für Luft- und Raumfahrt erproben am Institut für Werkstoff Forschung KI-Methoden an metallischen Werkstoffen aus dem Flugzeugbau. Das Ziel der Wissenschaftler ist die Eigenschaften der eingesetzten Werkstoffe bis ans Limit auszunutzen, um die Einsatzdauer von Flugzeugen präziser vorherzusagen und ggf. auszuweiten. Damit werden zum einen Kosten und Ressourcen eingespart und gleichzeitig in die Sicherheit investiert. Auch werden nur dort Materialien in einem Flugzeug verbaut, wo sie aufgrund ihrer Eigenschaften wirklich gebraucht werden. So lässt sich auch das Gewicht des Flugzeugs und damit der Treibstoffverbrauch senken. Eingesetzt werden dafür zum Beispiel Verfahren der digitalen Bildkorrelation und des Deep Learnings. Mehr.
#23 Bilddatenanalyse als Informationsgrundlage für den Artenschutz
Sie ist die Grundlage nahezu aller Maßnahmen im Hinblick auf den Artenschutz. Die Information über die Größe der noch bestehenden Population. In ausgedehnten und unübersichtlichen Landschaften gestaltet sich die Erfassung schwierig. Deswegen setzen Biologen für die tierischen „Volkszählungen“ bereits seit Längerem auf Drohnen zur Datenerfassung über Bildaufnahmen. Doch oft gestaltet sich die Auswertung dieser Luftaufnahmen als komplex, da Landschaftselemente, wie z.B. Pflanzen, sich mitunter nur schwer von Tieren unterscheiden lassen. Das Deep Learning basierte Programm kann durch Training selbstständig lernen Tiere von anderen Formen zu unterscheiden. Entscheidend dabei: Es darf kein Tier übersehen werden. Deswegen verfügt der Algorithmus über eine große Toleranz, was zu mehr falsch-positiven Befunden führt. Die Arbeitserleichterung für die Biologen: Die KI sortiert die Aufnahmen aus, auf denen keine Tiere zu sehen sind und markiert in den anderen Bildern die erfassten Tiere zur schnelleren händischen Überprüfung. Dadurch können Tierzählungen nun deutlich häufiger als bislang durchgeführt werden. Mehr.
#24 Open Source: Die Grundlage von Data Science und ein Geschenk an die Welt
Der 24. Dezember ist gekommen, es ist Heiligabend – frohe Weihnachten. Heute blicken wir zum Abschluss unseres Data Science Adventskalenders nicht auf eine bestimmte gute Tat, sondern auf eine Initiative, die 1998 gegründet wurde und den entscheidenden Baustein von Data Science geliefert hat: Open Source. Data Science ist ein Themenbereich, der in besonderem Maße von Open Source profitiert. Freie Skriptsprachen wie R, Python und Julia, Big-Data-Frameworks wie Spark und Hadoop oder die Programmbibliothek TensorFlow zum Deep Learning: Es hat sich ein großes Ökosystem an quelloffenen Softwarelösungen für die Anforderungen im Umfeld von Big Data, Künstlicher Intelligenz und Machine Learning entwickelt. Damit ist die weltweite Community, die das Data-Science-Toolset stetig weiter vorantreibt, untrennbar verbunden mit guten Data-Science-Taten. Mehr.