„Big Data“ arbeitet für Werbung und Wahlkampf
Berlin (dpa) - Auf unseren Wegen durchs Netz hinterlassen wir tiefe Datenspuren. Über uns werden schon mehr Informationen gespeichert als wir selbst in Form von digitalen Texten oder Fotos erzeugen.
So lautet eines von mehreren Ergebnissen einer Studie zum Datenaufkommen, die der Speicherspezialist EMC am Dienstag veröffentlicht hat. Die Menge aller digitalen Daten, die in einem Jahr erzeugt oder genutzt werden, erreicht 2012 demnach 2,8 Zettabyte oder 2,8 Billionen Gigabyte. Dieser Umfang verdoppelt sich ungefähr alle zwei Jahren; bis 2020 sollen es 40 Zettabyte sein. Und damit wachsen auch die Möglichkeiten, Daten für Erkenntnisse aller Art zu verknüpfen: „Big Data“ heißt das Zauberwort.
„Die einstige Kapazitätsbegrenzung beim Speichern von Daten ist heute keine Verbündete des Datenschutzes mehr“, bedauert der Bundesdatenschutzbeauftragte Peter Schaar im Gespräch mit der Nachrichtenagentur dpa. „Das ist definitiv vorbei, Speicherplatz ist kein Knappheitsfaktor mehr.“
In der weitgehend kostenlosen Internet-Welt sind Daten zu einer Art Währung geworden. Sie werden für die Online-Werbung analysiert, um die Zielgruppe genauer erreichen zu können. Im US-Wahlkampf wurden Daten aus Sozialen Netzwerken analysiert, um unschlüssige Wähler ausfindig zu machen. Bei der Wirtschaftsauskunftei Schufa gab es die Überlegung, ob Facebook-Daten für die Bewertung der Bonität von Kreditkunden genutzt werden könnten. „Wir erkennen, dass das teilweise ganz bewusst genutzt wird, um unser tägliches Verhalten auszuforschen, ohne dass wir etwas davon bemerken“, warnt Schaar.
Immer größer wird der Anteil von Daten, die nicht von Menschen, sondern von Maschinen erzeugt werden: 2005 waren das 11 Prozent, bis 2010 sollen es schon 40 Prozent werden. „Wir haben unsichtbare Datensammler in unseren Smartphones, Kraftfahrzeugen und anderen Geräten, die laufend Daten generieren“, sagt der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit und fügt hinzu: „Das macht mir natürlich große Sorgen.“ Nach der Schätzung von EMC könnten heute 23 Prozent der insgesamt erzeugten Datenmenge für Big-Data-Analysen genutzt werden - tatsächlich aber geschieht dies nur mit 0,5 Prozent der Datenmenge. Dafür gebe es drei unterschiedliche Gründe, sagt Sabine Bendiek, Deutschland-Chefin von EMC: „Erstens die Unsicherheit beim Datenschutz. Zweitens die fehlende Technik zur Auswertung dieser Daten. Und drittens die Mechanismen für die Entwicklung der richtigen Fragen.“
Big Data bedeutet technologisch, so erklärt es die Managerin, dass Daten aus den unterschiedlichsten Quellen zusammengeführt und auf ganz unterschiedliche Zusammenhänge hin untersucht werden. Dies könne schon mal dahin führen, „dass Big Data Antworten auf Fragen liefert, die man gar nicht explizit gestellt hat“. Weil die meisten anfallenden Daten in unstrukturierter Form gespeichert sind, also nicht mit eindeutig adressierbaren Datenfeldern wie Alter oder Postleitzahl, ist ihre automatisierte Auswertung schwierig.
EMC-Managerin Bendiek betont, dass da die Vorgaben des Datenschutzes unbedingt einzuhalten sind. „Man kann aber auch sehr viel anonymisieren und viele Anwendungsfälle entwickeln, bei denen man etwa Profildaten nutzt, ohne den spezifischen Namen zu verwenden. Das sicher zu gestalten, ist machbar.“
Die Möglichkeit zum Missbrauch ist aber nicht von der Hand zu weisen. Datenanalysen können unter Umständen auch wieder „re-anonymisiert“ werden, die Ergebnisse könnten dann bestimmten Personen zugeordnet werden.
„Dass man versucht, mit der Verknüpfung von Daten eine Bewertung potenzieller Kunden zu erlangen, um ihnen zum Beispiel gezielt Werbung zuzusenden, ist noch die harmlosere Variante“, erklärt Schaar. „Umgekehrt können auch Personen ermittelt werden, denen man möglichst keinen Kredit gewährt oder denen man eine Wohnung nicht vermietet - und das nur deshalb, weil das Datenprofil einen schlechten Score-Wert erzeugt. Da kann sich der Einzelne nicht wehren, wenn er aufgrund einer statistischen Wahrscheinlichkeit zu einer risikobehafteten Gruppe gesteckt wird.“
Big Data fordert die Datenschützer denn auch heraus, spezifische Antworten für den Schutz der Privatsphäre zu entwickeln. Schaar plädiert für „einen Instrumentenmix aus gesetzlichen Regelungen, die der technischen Entwicklung angepasst werden müssen, und aus technologischen Lösungen“. Das Zauberwort heißt „Privacy by Design“: Der Datenschutz soll schon in die Geräte eingebaut werden. „Die Hersteller von Smartphones müssen zum Beispiel dafür sorgen, dass die Betriebssysteme persönliche Daten einkapseln, damit sie nicht durch beliebige Apps ausgelesen werden können, wie das immer stärker geschieht“, fordert Schaar.
Dabei richtet sich auch der Blick auf die Bundestagswahl 2013. „Keine Partei kann es sich leisten, das Potenzial von Big Data im Wahlkampf ungenutzt zu lassen“, sagt der Kampagnen-Stratege Julius van de Laar. „Einige der Maßnahmen, die bereits im US-Wahlkampf zum Einsatz kamen, werden auch in Deutschland eine wichtige Rolle spielen“, fügt der Berater hinzu, der im US-Staat Ohio für den Wahlkampf von Barack Obama gearbeitet hat. „Gleichzeitig ist vieles, was in den USA an Data Mining gemacht wurde, in Deutschland aufgrund von datenschutzrechtlichen Gründen und mangelnder Ressourcen unvorstellbar.“
Auch Datenschützer Schaar rechnet damit, dass Big-Data-Analysen im Wahljahr ein großes Thema werden. Alle Parteien seien gehalten, „sich vorbildlich in Datenschutzfragen zu verhalten und nicht auf die Idee zu kommen, hier amerikanische Wahlkampfmethoden zu imitieren.“