Republica TEN – 10 Jahre Republica. In ihrem Jubiläumsjahr widmete sich DIE Veranstaltung für digitale Themen in einer Art Selbstreflexion verschiedensten Aspekten, die schon lange aktuell sind und es auch noch eine Weile bleiben werden. Einer dieser immerwährenden Dauerbrenner ist das Thema Big Data. DAS Buzz Word der letzten Jahre wurde auch im 10. Republica-Jahr wieder stark diskutiert und in all seinen Facetten beleuchtet. Denn, wie Yasmina Banaszczuk im Titel ihrer Session zusammenfasste: Wir alle lieben Big Data.

Doch was ist mit Big Data überhaupt gemeint und wie beeinflusst es unser tägliches Leben? Welche Möglichkeiten bietet die enorme Menge an Daten, die tagtäglich gesammelt wird und welche Gefahren sind damit verbunden?

Big Data meint – ganz einfach übersetzt – zunächst einmal eine enorm große Menge an Daten. Doch nicht nur das reine Datenvolumen ist in den letzten Jahren stark angestiegen, auch die Geschwindigkeit, in der Daten heutzutage gesammelt und zusammengeführt werden können, ist kaum noch nachzuvollziehen. Die Sammlung von Daten bspw. über Ortungsdaten auf dem Handy oder über Fitnesstracker passiert heute schon fast nebenbei. Und wer ist sich schon immer bewusst darüber, wie und wo unsere Daten über welche Kanäle gesammelt werden? Dass die Datenströme dabei sinnvoll genutzt werden und sogar gesellschaftliche Veränderungen bewirken können, machten gleich mehrere Speaker auf der Republica deutlich. Die Gefahren und auch die Verantwortung, die damit einhergehen, wurden jedoch auch nicht verschwiegen.

Am ersten Tag des digitalen Festivals sprach Kate Crawford, Principal Researcher bei Microsoft Research, über die sozialen Auswirkungen von Big Data. Unter dem prägnanten Titel „Know your terrorist credit score!“ fasste sie in ihrer Session zusammen, wie im Zuge einer riesigen Datensammlung für einzelne Personen ein Score errechnet werden kann, der dann zu deren Kategorisierung  herangezogen werden kann. In einem konkreten Beispiel beschrieb sie, wie im Rahmen der aktuellen Flüchtlingskrise eine bestimmte Person beobachtete, dass einige Flüchtlinge, die aus den Booten stiegen, „zu gesund“ aussahen. Die Person trat daraufhin an das US-amerikanische IT- und Beratungsunternehmen IBM heran mit der Anfrage, ein computergestütztes Analyseverfahren zur Bewertung der Flüchtlinge zu entwickeln. IBM sagte zu und sammelte neben Daten aus dem „Dark Web“ (z.B. Käufe von gefälschten Pässen) auch Daten aus sozialen Netzwerken (wie z.B. Ähnlichkeiten bei Twitter Likes), die in die Analyse einbezogen wurden. Diese Daten wurden mit weiteren Daten wie bspw. Parktickets kreuzkorreliert, um ähnliche Verhaltensmuster und längere Aufenthalte an bestimmten Orten und somit eine potenzielle Terrorgefahr erkennen zu können. Auf Basis dieser Daten wurde dann der „terrorist credit score“ entwickelt. Auch wenn IBM in der Kommunikation sofort zurückruderte und betonte, der Score sei kein definitiver Marker für Schuld oder Unschuld, konnte so ein außergewöhnlich genaues Personenprofil erstellt werden.

Dieses eher negative Beispiel verdeutlicht die Möglichkeiten, die durch die Big Data Analyse für Unternehmen, aber auch für die Regierung entstehen und eine regelrechte Überwachung und Bewertung von Bürgern ermöglichen.

Sarah Williams vom Civic Data Design Lab, Massachusetts Institute of Technology’s (MIT) berichtete in ihrer Session „Big Data for a Public Good” über eine weitaus positivere Möglichkeit, Big Data zu nutzen. Sie betonte, dass Visualisierungen öffentlicher Daten sogar gesellschaftliche Veränderungen bewirken können. Nach Sarah Williams sind drei Punkte für den zukünftigen Umgang mit Big Data wichtig: Zum einen müsse die Fähigkeit und Ausbildung, große Datenmengen zu lesen, auch in der breiten Öffentlichkeit gefördert und verbessert werden. Zum anderen sei es von großer Bedeutung, neue Tools zu entwickeln, die eine einfachere Datenauswertung ermöglichen. Schlussendlich sollten nach Williams privat erhobene Daten als öffentliches Gut einer breiten Öffentlichkeit zugänglich gemacht werden. Als Beispiel führt sie das Projekt „Digital Matatus“ an, im Rahmen dessen sie mit ihrem Team einen Plan für das lokale Transportsystem entwickelte. Dazu wurden die Mobilitätsdaten aller Matatus in Nairobi analysiert und auf Grundlage von diesen getrackten Daten ein Fahrplan bzw. eine Übersichtskarte ähnlich den U-Bahn-Plänen in anderen Städten entwickelt. Durch den direkten und offensichtlichen Vergleich mit anderen, bedeutenden Städten, entwickelte sich bei den Einwohnern und auch der Regierung ein gewisser Stolz für ihre Stadt und ihr Transportsystem. Darüber hinaus wurde ein Planungstool entwickelt, das öffentlich von allen Personen genutzt werden kann und gemeinsam mit Matatus-Fahrern weiterentwickelt wurde. Im Rahmen eines Hackathons wurden dann auf Basis der erhobenen Daten sogar Transportation-Apps entwickelt, die aktuell noch von den Bürgern genutzt werden. Der wichtigste Grundsatz für Williams bei der Arbeit mit Big Data lautet dabei stets: Open Data – Receive Data. Für sie bedeutet das, dass Daten öffentlich zugänglich gemacht werden müssen, damit ein größerer Datenpool entstehen kann.

Auch in Deutschland ist die Beschäftigung mit Big Data ein großes Thema. Unter dem Titel „Big Data und Arbeitnehmer“ diskutierte Johannes Kleske (Geschäftsführer Third Wave) mit Andrea Kocsis (stellvertretende Vorsitzende ver.di) und Andreas Dewes (CTO Quantified Code) über den Einfluss von Big Data auf den Arbeitsalltag und die daraus resultierenden grundlegenden Veränderungen in der Arbeitswelt. Dass sich auch Gewerkschaften mit diesen Aspekten in Bezug auf den Persönlichkeitsschutz auseinandersetzen müssen, verdeutlichte Andrea Kocsis anhand einiger Beispiele. So führt bspw. die GPS-Ortung von Paketzustellern dazu, dass der Kunde zwar immer genau weiß, wo sich sein Paket gerade befindet, der Arbeitnehmer jedoch auch rund um die Uhr überwacht werden und seine Arbeitsleistung getracked werden kann. Ein weiteres Beispiel sind Datenbrillen, die aktuell bereits in der Logistikbranche eingesetzt werden und über die direkt angezeigt wird, wo welche Pakete gelagert sind. Der Arbeitnehmer kann so schneller arbeiten, da er keinen Informationszettel mehr in der Hand halten muss und beide Hände für die Arbeit frei hat. Es kann aber auch genau festgehalten werden, wie viel die Person arbeitet und wie lange sich die Person wo aufhält. Die andere, positive und effektive Seite der Big Data-Analyse ist das Modelling: Prozesse und Strukturen auch im Arbeitsalltag können auf Basis der Ergebnisse optimiert werden.

Weitere beeindruckende Beispiele für die Nutzung und Weiterverarbeitung offener Daten sind die digitalen Datenjournalismus-Projekte, die vermehrt auch in traditionellen Nachrichtenredaktionen umgesetzt werden. Ein Beispiel dafür ist das Datenprojekt von Julius Tröger und seinem Interaktiv-Team bei der Morgenpost. Die Journalisten haben anhand des Verlaufs der Buslinie M29, die vom Berliner Villenviertel Grunewald bis nach Neukölln führt, das „soziale Universum der Stadt“ nachgezeichnet. Durch die Zusammenführung und interaktive Darstellung offen zugänglicher Daten, wie Wahlergebnisse, Arbeitslosenquote, Alter, Mietpreise u.a. wird deutlich, wie unterschiedlich Berlin und seine Bewohner sind. Die verwendeten Rohdaten sind darüber hinaus als Excel-Datei offen zugänglich und können von interessierten Bürgern weiterverwendet werden.

Die Diskussion rund um Big Data sowie der ethische Umgang mit den gesammelten Daten verdeutlicht, dass bereits einiges möglich ist und die Daten vielfältig – sowohl in positiver, als auch negativer Hinsicht – genutzt werden können. Immer wichtiger wird jedoch auch die Verantwortung, die bei den „Datensammlern“ liegt: Sie müssen bewusst mit den Daten umgehen, Daten öffentlich zugänglich machen und bei der Entwicklung von Software direkt ethische Aspekte mitdenken.

The following two tabs change content below.

Pin It on Pinterest

Bitte weitersagen!

Teilen Sie den Artikel mit Ihren Freunden!