Data Science: Mehr als nur ein technisches Thema

Was kann Künstliche Intelligenz (KI) leisten? Wie entwickelt man faire Algorithmen bzw. etabliert ein erfolgreiches Data Mindset in Unternehmen? Kann KI sogar Gleichberechtigung fördern? Diese und weitere spannende Fragen wurden bei der Swiss Conference on Data Science (SDS) in Keynotes und Workshops diskutiert. Die SDS fand bereits zum 9. Mal in Folge am 22. und 23. Juni 2022 in Zürich und Luzern statt. Das Programm war ebenso vielfältig wie die Herkunft der Teilnehmer selbst, die aus der ganzen Welt anreisten. Eines steht für mich nach dem Besuch dieser Konferenz jedenfalls fest: Data Science ist mehr als ein rein technisches Thema.

SDS 2022 - Location

Data Science: Mehr als nur Technik

Faszinierend für mich war, dass die aufgegriffenen Themen nicht nur technische Aspekte beleuchteten, sondern in den Use Cases zahlreiche Beispiele aus dem Alltag aufgegriffen wurden. Das zeigte vor allem eines: Data Science ist mehr ein “Sammelsurium” von Daten und Modellen. Es spielt mittlerweile in vielen Lebensbereichen eine wesentliche Rolle und bietet Lösungen für brennende Fragen, wie z.B. den Klimawandel. Im Vortrag How much evidence do you need? wurde der Einfluss von Covid-19 auf die Umwelt und das Klima thematisiert, wobei die Frage aufgeworfen wurde, wie viel Datenevidenz benötigt wird, um ein objektives Ergebnis zu erzielen. So analysierten Forscher die Wetterdaten während bzw. vor der Pandemie und zeigten die Auswirkungen der eingeschränkten Mobilität auf das Wetter. Dabei wurden unzählige Wetterdaten (z.B. Luftfeuchtigkeit, Partikelbelastung, Temperatur, Luftqualität etc.) von Messstationen und Satelliten gesammelt und miteinander verglichen. Dabei wurde untersucht, ob es eine Korrelation zwischen der Veränderung der Daten und der Pandemie (unabhängig von üblichen Klimaschwankungen) gab. Data Science sollte die angestellten Vermutungen und Modelle beweisen, doch: Wie viele Daten braucht man, um ein valides Ergebnis zu bekommen? Woher bezieht man diese und in welchen Zusammenhang werden sie gesetzt? Der Vortrag regte jedenfalls zum Nachdenken an und skizzierte z.B. die Möglichkeit, mit Hilfe von Data Science, Lösungen für den Kampf gegen den Klimawandel zu finden.

Erhöhung der Gleichberechtigung durch Machine Learning?

Ein weiterer Vortrag von UBS zeigte das Potential von Machine Learning hinsichtlich einer fairen Gleichberechtigung durch die Bereinigung von Daten. Dabei zeigte der Vortrag mit dem Titel “Responsible use of AI/ML at UBS”, welchen Einfluss Machine Learning in Sachen Gleichberechtigung bzw. Gleichbehandlung von Daten hat. Wieso diese Frage relevant ist? Weil Data Science auf Modellen basiert, die anhand von vorliegenden Daten entwickelt werden. Daraus lassen sich Zusammenhänge und Abhängigkeiten ableiten, die wiederum in einem Modell verankert werden. An einem einfachen Beispiel erklärt, können Maschinen anhand dieser Modelle lernen, wie lange es in der Nacht dunkel ist, wann die Dämmerung einsetzt und wie lange es hell ist. Dadurch lassen sich dann Vorhersagen zum Beispiel für Risikobewertungen oder die Erzeugung von Solarenergie treffen.

Beruhen die historischen Datenmodelle jedoch auf Ungleichbehandlungen, kann das zu einer fortführenden Diskriminierung der Vorhersagen führen. So kann zum Beispiel eine Kfz-Versicherung keine valide Risikobewertung für ausländische Staatsbürger treffen, wenn in den Datenmodellen zu wenige oder nur einseitige Daten für ausländischen Staatsbürger vorliegen. In weiterer Folge könnte dann der Effekt der fehlenden validen Daten durch das Modell weiter verstärkt werden, so dass die Kfz-Versicherung nur mit höchsten Risikowertungen kalkuliert und der ausländische Fahrer oder die ausländische Fahrerin vielleicht als Raser bzw. Raserin kategorisiert werden, obwohl das überhaupt nicht mit dem tatsächlichen Fahrverhalten zusammenhängen muss.

Was kann Data Science an dieser Stelle ändern? Durch die Korrektur der Datenbasis kann eine Gleichberechtigung wiederhergestellt werden, die Unternehmen dabei unterstützt, bessere Vorhersagen bzw. Risikoabschätzungen vornehmen. Das ist jedoch kein einfaches Unterfangen. Die Herausforderung liegt in der Bereinigung der Daten mit Hilfe von KI ohne den Verlust von signifikanten Informationen. Nur so können künftig valide Entscheidungen getroffen werden, die frei sind von Diskriminierungen. So oder so ist Data Science ein hoch spannendes und komplexes Thema, mit dem man (un)wissentlich immer wieder im Alltag in Berührung kommt.

SDS 2022 - Vortrag

Fazit

Die oben genannten Beispiele zeigen, dass Data Science dabei helfen kann, bessere und schnellere Entscheidungsgrundlagen zu schaffen und Prozesse zu optimieren. Dadurch können zeitaufwendige und wiederkehrende Tasks automatisiert und die gewonnene Zeit für die spannenden Aufgaben genutzt werden. Neben diesen positiven Aspekten darf meiner Meinung nach eine kritische Auseinandersetzung mit diesem Thema nicht ausser Acht gelassen werden. In einigen Entscheidungen kann man vermutlich hinterfragen, inwieweit man sich auf Ergebnisse, die auf Künstlicher Intelligenz basieren, verlassen darf. Überlässt man die Entscheidungsmacht bei gewissen Fragen dann doch lieber dem Menschen? Wie geht man mit Fehlern um bzw. wie hält man diese möglichst gering? Spannende Fragen, auf die es noch keine eindeutigen Antworten gibt.

Über die SDS 2022

Die Schweizer Data Science Konferenz (Link: https://www.sds2022.ch ) fand am 22. und 23. Juni 2022 in Zürich und Luzern statt und wurde mittlerweile zum neunten Mal veranstaltet. Ihr Ziel ist es, Datenwissenschafter, Entwickler, Meinungsführer, Entscheider und Pioniere miteinander zu verbinden und so einen Wissensaustausch für innovative Produkte und Services zu ermöglichen. In Workshops und Keynotes dreht sich alles um die Themen Künstliche Intelligenz (KI) in Sachen Cybersecurity, Data Protection, Machine Learning Based Systems (MLOps) u.v.m.

;