Big Data – Was du letzten Sommer nicht getan hast

Der Fluch des Savants

„Behörden und Unternehmen können ruhig alles über mich wissen. Ich habe ja nichts zu verbergen“. Wie oft habe ich diesen Satz schon in meinem Leben gehört, während ich versuchte, an Infoständen und bei Diskussionen das abstrakte Thema der Überwachung und Datensammelwut von Behörden und Unternehmen zu vermitteln. Wie viele Mühen wurde bereits unternommen, um dem Thema die Abstraktion zu nehmen, den Betroffenen emotional vor Augen zu führen, wie sich Überwachung auf ihre Privatleben auswirken würde? Ein Drahtseilakt zwischen dem Vorwurf gesetzlicher Unredlichkeit („wer ist schon immer gesetzestreu?“), der oft zu ablehnenden Reaktionen führt, und dem Überschreiten der Schamgrenze mit dem Bildnis der Überwachungskamera in Schlaf- und Badezimmer. Alles nur, um dem Totschlagargument „wer nichts zu verbergen hat, hat auch nichts zu befürchten“ zu begegnen. Doch ist das wirklich so? Haben denn nicht gerade diejenigen, die alles offen legen, Nachteile zu befürchten, und sei es nur durch Informationsasymmetrie?

Nehmen wir einmal den – psychologisch bestimmt ungesunden und unglaubwürdigen – Zustand an, dass alle Menschen nichts zu verbergen hätten und vom Zeitpunkt des Aufstehens bis zum Schlafengehen ein gesetzestreues Leben führen würden. Vermutlich wäre dies das Paradies auf Erden, oder die Hölle, je nach Blickwinkel. Eine Art gesellschaftlicher Wärmetod, ohne jegliche Reibung, ohne jegliche Spannung. Jedenfalls würde diese Utopie vollkommen überwacht werden, um den Status Quo aufrecht zu erhalten. Es würden gigantische Datenmengen anfallen, die gefiltert und analysiert werden müssten. Und damit würde sich die Frage stellen: was soll überhaupt gesammelt und analysiert werden? Welche Daten sind überhaupt relevant?

Unser Gehirn hat auf diese Frage eine einfache Antwort: es werden zwar pro Sekunde etwa 100 MB an Daten gesammelt, aber nur ein Bruchteil davon wird überhaupt verwertet und ein noch geringerer Teil davon behalten. Was wir letztendlich im Gedächtnis behalten hängt von sehr vielen Faktoren ab, wie zum Beispiel dem Fokus unserer Aufmerksamkeit, unserer Aufnahmefähigkeit, der Bekanntheit des Vorgangs, der emotionalen Bindung, der Zahl der Wiederholungen und vielem mehr. Die Unmengen an Daten, die aus unserer komplexen Umwelt an uns dringen sorgen somit nicht für eine Überlastung unserer mentalen Kapazitäten, sondern die Komplexität wird herunter gebrochen und mit uns bereits bekannten Daten verknüpft. Das, was wir wahrnehmen, hängt also in großem Maß von dem ab, was wir bereits kennen. Wir können allerdings durchaus auch „wahrnehmen“, was nicht existiert und was uns lediglich unser Gehirn vorgibt.

But what if we add… MORE DATA!

Ein Mehr an Daten bedeutet nicht automatisch eine Verbesserung der Erkenntnis von Situationen, sondern mehr Daten können zu einer Art Informationsrauschen führen, in der jegliche Struktur verloren geht. Die Art und Weise, wie man „Sinn“ in diese Datensammlung bringt, ist daher von höchster Wichtigkeit. „Sinn“ ist hier als eine Art Metaebene zu sehen, auf der die gesammelten Daten nach bestimmten Merkmalen durchsucht werden, um eine gegebene Komplexität zu „verstehen“. Der Analyst/Betrachter hat stets eine gewisse Intention, mit der diese Daten betrachtet werden. Bei den RAF-Rasterfahndungen in den 70er-Jahren zum Beispiel ging es darum, Anhaltspunkte für den Aufenthaltsort von Terroristen zu finden. Bei Marktforschung von Unternehmen geht es darum, den Markt und seine Teilnehmer in Bezug auf die Absatzmöglichkeiten zu analysieren. Die Intention, mit der diese Datensammlungen betrachtet werden, sind entscheidend im Hinblick auf die zu erwartenden Resultate. What you see is all there is.

Es mag zwar nicht wissenschaftlich achtbar sein, nur Daten zu sichten, die für die eigenen Theorien sprechen, statt durch Falsifizierung nach ihrer Ungültigkeit zu suchen, aber es ist nun mal zutiefst menschlich im Streben nach Anerkennung und Bestätigung. Das eigene Weltbild muss doch, einer sich ständig wechselnden Umgebung zum Trotz, fest verankert sein und darf nicht bei jeder neuen Information gleich ins Schwanken geraten! Aber wie ist diese ständige mentale Adaption der „objektiven Realität“ an „unsere Realität“ im Hinblick auf gesammelte Daten zu bewerten? Menschen sind großartig darin, Muster zu erkennen, die sie einmal erlernt haben. Wenn wir Datenansammlungen sehen, versuchen wir, darin Muster zu erkennen, sprich: diesen Daten „Sinn“ zugeben. Sinn steht hierbei für mich gleich der Verankerung des Beobachteten im bereits Bekannten. Im neuronalen Netzwerk unseres Gehirns werden bekannte Verbindungen verstärkt oder mit bereits bekannten Verknüpfungen verbunden.

Unendlich viele Affen, die in Bibeln blicken

Die Gefahr, die nun besteht, ist, dass in den Datensammlungen nach Merkmalen gesucht wird, die in bestimmte „Bilder“ passen. Ein Herr S. sucht Daten, die schlüssig beweisen können, dass Ausländer gewalttätig und arbeitsscheu sind. Also sucht er Daten, die zu diesem Bild passen und ignoriert Daten, die nicht seine Theorie widerlegen würden. Statistische Fehler, die dabei gemacht werden, gehen im emotionalen Rauschen der Empörungswellen unter. Das wird man doch noch sagen dürfen! Ja, aber bitte nicht nachrechnen.

Nehmen wir Wachtmeister K. als Beispiel. Er kennt seine Papenheimer sehr genau und weiss, nach welchen Merkmalen er Ausschau halten muss, um Drogendealer und Kleinkriminelle zu erwischen. Dass auf 100 festgehaltene „Verdächtige“ dunklerer Hautfarbe gerade 1-2 „Erfolge“ vorzuweisen kommen, ist dabei unerheblich: Jeder noch so kleine Erfolg bestätigt seine Theorie, da es keine Vergleichszahlen gibt und aufgrund des Erfolgs nicht der Versuch unternommen wird, herauszufinden, ob die örtlichen Kriminellen vielleicht dazu übergegangen sein könnten, hellhäutige Kuriere zu engagieren, weil diese seltener untersucht werden. In komplexen Systemen bleiben „Erfolgsgaranten“ aufgrund von Rückkopplungen nicht fortdauernd erfolgreich, sondern tragen zunehmend zu einer Destabilisierung bei, weil „unerwünschtes“ Verhalten nicht mehr erkannt wird, so lange einmal festgelegte Regeln/Theorien nicht revidiert werden.

Ein sehr schönes Beispiel für Theoriebildung bei umfangreichen Ausgangsdaten, die mit genügend Phantasie bei der Mustererkennung zu spektakulären Resultaten führte, liefert der sogenannte „Bibelcode“. Anhand der Bücher Mose fand der Journalist Drosnin in der Bibel „codierte“ Hinweise auf zukünftige Ereignisse, wie zum Beispiel der Ermordung des Kennedy-Attentäters Oswald durch Ruby, oder dem Fall der „Zwillingstürme“ an 9/11. Anhand der Datenmenge und durch Anpassung der Such-Schmeta war es nun relativ einfach, derartige Textstellen zu identifizieren und der Bibel und ihren Autoren somit prophetische Eigenschaften zuzuschreiben. Später wiesen einige Mathematiker nach, dass man mit ähnlicher Methode auch prophetische Nachrichten im Buch „Moby Dick“ nachweisen konnte. Korrelation hatte über Kausalität und der Glaube an das Phantastische über die Vernunft gesiegt. Was bei Religionen übrigens nicht unbedingt selten vorkommt.

Teekannen im Orbit

Die Gefahr, die nun von großen Datensammlungen ausgeht, ist also nicht nur, dass man ein Verhalten nachweisen kann, das nachweislich strafbar ist, sondern dass ein Verhalten aus den Daten heraus konstruiert werden kann, das zudem rational belegbar ist. Wenn ich mich per Zufall in einer Funkzelle befinde, in der ein Verbrechen verübt wird, gerate ich durch meine pure Anwesenheit bereits in den Fokus der Ermittlungen. War ich in der Vergangenheit schon mal auffällig? Wurde ein ähnliches Verbrechen vielleicht bereits vor einer Woche verübt und war ich vielleicht ebenfalls in der Umgebung? Muss ich vielleicht durch Abgabe einer DNS-Probe „beweisen“, dass ich nicht an einer Tat beteiligt war? Werden die Proben nach der Untersuchung tatsächlich vernichtet?

Durch die Menge an Daten ist es möglich, derart viele Verdachtsmomente zusammenzufügen, um einer Person ernsthaft zu schaden. Man konstruiert spielend weitere Anhaltspunkte für das tiefere Eindringen in das – eigentlich besonders streng geschützte – private Umfeld. Solche Eingriffe müssen nicht einmal von staatlicher Seite unternommen werden, sondern können zum Beispiel durch Medien erfolgen. RTL 2 und Bunte ermitteln. Misshandelt diese Prominente ihr Kind? Ist der brave Bankangestellte nur die Fassade für sexuelle Ausschweifungen? Je mehr Daten vorhanden sind, desto leichter lassen sich Zusammenhänge konstruieren und das Vermarkten und die Analyse von Zusammenhängen ist ein lukratives Geschäftsfeld. Wo auch nur ein Kontext vermutet wird, ist für Menschen auch schnell ein tatsächlicher Kontext vorhanden, weil oftmals das Bewusstsein für statistische Zusammenhänge fehlt. Und warum nach komplizierten Lösungen suchen, wenn die einfache Lösung doch bereits „rational“ ermittelt auf der Hand liegt? Zahlen lügen nicht! Und Skandale bringen Quote und Einnahmen.

Wo nun einmal der Anfangsverdacht besteht, wird es für den Betroffenen schwer sein, das Gegenteil nachzuweisen, denn aufgrund der Informationsasymmetrie stehen die erhobenen Daten nur dem Ankläger zur Verfügung. Ein Beispiel hierfür sind die Ermittlungen gegen die bundesdeutschen Nachrichtendienste und Verfassungsdienste: Auf der Seite der Geheimdienste gibt es riesige Datensammlungen, deren Zustandekommen und Umfang oft nicht einmal den für die Überwachung dieser Behörden zuständigen Regierungsstellen bekannt sind, auf der anderen Seite gibt es den Besitzer eines kleinen Gehirns, das oftmals schon vergessen hat, was es vorgestern zum Frühstück gab. Wie soll nun ein Beschuldigter glaubhaft darlegen können, dass er etwas nicht begangen hat, wenn die „Beweise“ dafür sprechen? Zur falschen Zeit am falschen Ort.

Es ist also möglich, trotz bestehender „Unschuldsvermutung“ mit vorhandenen Daten nicht nur einen Anfangsverdacht,  sondern hinreichend Indizien zu produzieren, die vielleicht sogar für eine Verurteilung reichen würden. Damit sind nicht nur diejenigen gefährdet, die sich ungesetzlich verhalten, sondern gerade diejenigen, die durch Korrelation unverschuldet in das Umfeld ungesetzlicher Handlungen geraten. Dem Nachweis der Schuld durch gesammelte Daten ist oft nichts entgegenzusetzen, da der Betroffene selbst eben nicht Einblick in die Daten erhält, sondern lediglich in das erkannte Muster, unabhängig davon, ob durch eine alternative Interpretation sich dieses Muster als reine Spekulation entpuppen würde. Letztendlich hat also jeder etwas zu befürchten, jeder etwas zu verlieren, wenn unkontrolliert Daten gesammelt werden, deren Analyse so gut wie keiner Kontrolle durch demokratische Instanzen unterworfen ist, wie es de facto derzeit der Stand in Deutschland und zahlreichen anderen Ländern ist. Es kann jeden treffen, nicht nur „Straftäter“.

Null Collect

Die beste Verteidigung gegen derartige Datenmonster ist die komplette Vermeiden der Erhebung der Daten, sei es durch Mautbrücken, elektronische Gesundheitskarten, Sammeln von elektronischen Kommunikationsdaten und den zahlreichen privatwirtschaftlichen Methoden und Gängelungen am Verbraucherschutz vorbei. Die inhärente Gefahr des Erhebens und Auswertens von Daten ist dabei nicht der Missbrauch von „Vertrauen“ oder die Überprüfung des persönlichen Wohlverhaltens, sondern vielmehr die einer totalitären Unterdrückung persönlicher Freiheit ohne jegliche Rechtssicherheit entgegen der Intention der Menschenrechte. Das Bewusstsein der Möglichkeit einer Überwachung unterscheidet sich nur noch unmerklich vom Bewusstsein, dass man tatsächlich überwacht wird. Eine pluralistische Gesellschaft braucht jedoch die Vielfalt der Möglichkeiten, die aus den individuellen Freiheitsrechten erwachsen. In dieser Vielfalt liegt die Stärke, um in komplexen Gesellschaftssystemen Lösungen für Probleme erarbeiten zu können. Der Schutz dieser Lebensräume sollte oberstes Prinzip jeder verantwortungsbewussten Regierung sein, nicht das Zerstören der Grundlagen dieser Ordnung für einen imaginären Sicherheitsgewinn, der durch Repression erzielt wird. Gesellschaften können auf Dauer nicht durch Repression überleben, sondern sie zerstören sich früher oder später von Innen heraus.

Weiterführende Links:

Russells Teekanne
http://de.wikipedia.org/wiki/Russells_Teekanne

Der Bibelcode/Tora-Code
http://de.wikipedia.org/wiki/Bibelcode

Falsifikation
http://de.wikipedia.org/wiki/Falsifikation

Das Gehirn und seine Informationsverarbeitung:
http://www.projectory.de/koreanisch/sprachenlernen/gehirn.html

Thomas Metzinger – Der Ego-Tunnel:
http://www.perlentaucher.de/buch/thomas-metzinger/der-ego-tunnel.html

Beispiel für eine optische Täuschung
http://www.sehtestbilder.de/optische-taeuschungen-illusionen/images/elefant-fuenf-beine.jpg

Rasterfahndung
http://de.wikipedia.org/wiki/Rasterfahndung

What you see is all there is – Thinking Fast And Slow
http://en.wikipedia.org/wiki/Thinking,_Fast_and_Slow

Freakonomics
http://freakonomics.com

Dieser Beitrag wurde unter Nicht kategorisiert veröffentlicht. Setze ein Lesezeichen auf den Permalink.

2 Kommentare zu Big Data – Was du letzten Sommer nicht getan hast

  1. Idahoe sagt:

    Hallo Heiko,

    es gibt hierzu einige rhetorische Fragen
    Was ist die Konsequenz einiger Begriffe (?):
    Was sind Rechte und welcher Zweck wird damit verfolgt?
    Was ist Sicherheit?
    Was ist Schutz?
    Erzeugt Schutz Sicherheit?
    Ist es sicher, wenn Du Rechte benötigst?
    Was sind Rechte? Regeln? Privilegien?
    Wer verleiht das Recht auf Leben?
    Beinhaltet ein Recht nicht auch Anweisungen?
    Wieviele Tote haben je ihr Recht auf Leben eingeklagt?
    Was ist Eigentum?
    Was ist Gleichberechtigung?
    Freiheitsrechte?
    Der Mensch ist frei, wenn er Anweisungen folgt?
    Benötigt ein Mensch erst Anweisungen, damit er andere Menschen nicht schädigt?
    Wer erteilt diese Anweisungen? Wer setzt sie durch?
    Müssen die, die Anweisungen erstellen bzw. Anweisungen durchsetzen, nicht mehr Rechte haben?
    Was geschieht dann mit der Gleichberechtigung?
    Bietet Recht Schutz und/oder Sicherheit?
    Muß ein Recht nicht auch überwacht und durchgesetzt werden?
    Sind Rechte der Ausdruck von Vertrauen?
    Ist Überwachung der Ausdruck von Vertrauen?
    Ist die Durchsetzung von Recht der Ausdruck von Vertrauen?
    Schützt sich der Mensch umso mehr, je sicherer es ist?
    Wen schützt das Recht überhaupt? Den Menschen?
    Wie kann etwas, das es nicht geben kann, Sicherheit erzeugen?
    Ist Folge der Behauptung von Recht, nicht die Erzeugung eines höheren Wesens?

    Zu positiver und negativer Freiheit
    Ist der Mensch wirklich oder geschaffene Realität?
    Ist der Staat wirklich oder geschaffene Realität?
    Ist Eigentum wirklich oder geschaffene Realität?
    Der einzelne Mensch ist bei Isaiah Berlin auch zugleich ein Teil des Staates.
    Wie kann der einzelne sich selbst gegenüber frei sein?
    Wie kann eine geschaffene Realität mit der Wirklichkeit in Bezug gesetzt werden?

    Was läuft schief mit dem Denken?
    Ist Glauben Denken?
    …Fragen über Fragen…

    Gruß

  2. Pingback: Reise des Verstehens » Blog Archiv » Dem Big Data Hype ein wenig Erdung einverleiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.