Was Joghurt mit Datenschutz und Machine Learning zu tun hat.

Je länger ich mich mit Machine Learning Konzepten und großen Datenmengen arbeite, desto mehr komme ich zum Schluss, dass wir unsere Vorstellung von Datenschutz grundlegend überdenken müssen. Das tönt jetzt erstmal befremdlich oder verstörend – ist aber, wie vieles in der heutigen Welt, eine Frage der Perspektive.

(Lesedauer 6 Minuten)

Daten sind Erfahrungen

Daten sind Erfahrungen. Je mehr Daten ein Machine-Learning gestütztes System in seine Entscheidungen und Wirkungsweise einfliessen lassen kann, desto besser werden ebendiese Entscheidungen. Damit dies immer besser funktionieren kann, benötigen wir die entsprechende Leistungsfähigkeit zur Verarbeitung dieser Erfahrungen. Je mehr von ihnen zu einem spezifischen Thema kombiniert werden können desto besser. So funktionieren wir als Menschen und dieselbe Logik gilt auch für maschinelle intelligente Systeme.

Das Aggregieren dieser Erfahrungen ist die Basis für das Lernen. Lernen geschieht dann, wenn wir die aggregierten Erfahrungen kombinieren und basierend darauf eine Aktion auslösen und den Erfolg dieser Aktion bewerten.

Dass wir etwas nicht gut können, liegt daran, dass wir entweder über zu wenig Erfahrung verfügen, zu wenig Intelligenz aufweisen um Erfahrungen kombinieren zu können oder aber eine verminderte Fähigkeit besitzen, die ausgelösten Aktionen zu bewerten und als veränderte Erfahrungslage für die nächsten Aktionen einzubeziehen. Oder, wie im heutigen Machine-Learning, an allen drei.

Kinder

Wie diese grob skizzierten Prozesse und Abhängigkeiten spielen, können wir sehr gut an aufwachsenden Kleinkindern beobachten – wenn wir mal den «Jö-Faktor» weglassen. Es ist faszinierend zu sehen wie Kinder sich in kleinen Schritten entsprechend «programmieren» – also Dinge lernen. Damit meine ich jetzt nicht das bewusste Lernen wie Lesen und Schreiben, sondern die unbewussten.

So habe ich z. Bsp. meine Frau des Öfteren kritisiert, als sie unseren sehr kleinen Kindern Joghurt zum Selber-Löffeln gab. Das Unterfangen endete Anfangs jedes Mal in der totalen Unordnung, weil die Kleinen nicht in der Lage waren das Zusammenspiel von bewegendem Becher, Löffel zum Mund führen, die richtige Dosierung der Joghurt-Menge auf dem Löffel etc. einzuordnen und entsprechend zu handeln. Weiter ist auch die motorische Fähigkeit anfangs nur ansatzweise vorhanden.

Das Resultat war jeweils, dass sich die Menge Joghurt die tatsächlich in des Kindes Magen fand mit der Menge Joghurt welche sich über Tisch, Stuhl, Pullover etc. verteilte, in etwa die Waage hielt (zu meinem Ärger).

Sauber Joghurt essen ist ein ziemlich schwieriger Task – den wir, resp. die meisten, Erwachsenen heute natürlich beiläufig können. Mit der Zeit aber realisierte ich, dass diese kleinen Menschen unglaublich schnell lernen. 2-jährige Kinder brauchen zwischen 15 und 35 «Joghurt-Ess» Erfahrungen um den Task mehr oder minder gut meistern zu können.

Ich führe das nicht im Detail aus, aber mein Überschlag ergab, dass es sich dabei um so ziemlich alle offensichtlichen Kombinationen handelt, was man beim Joghurt essen falsch machen kann (z. Bsp. Löffel falsch halten, Becher nicht halten, zu viel Joghurt auf dem Löffel etc.) Faszinierend ist, dass die meisten Menschen am Anfang des Lebens Fehler also nicht zwei Mal zu machen scheinen (wenn man berücksichtigt, dass Erfahrungen bisweilen einfach vergessen werden). Faszinierender finde ich, dass ohne diese Erfahrungen ein Lernen des Tasks Joghurt essen überhaupt nicht möglich wäre.

Computer sind nicht Menschen

Darin besteht ein wesentlicher Unterschied von menschlichen Systemen zu Computer. Die Erfahrungen können von aussen nur sehr schlecht in den Menschen transferiert werden. Wir können Informationen auswendig lernen, sicher, die Erfahrungen welche uns helfen komplexe Tasks zu meistern, müssen wir in der Regel immer selber machen. Ein langwieriger und aufreibender Prozess der bei den meisten Menschen im Laufe des Lebens auf abnehmendes Interesse stößt.

Computer hingegen können Daten und Erfahrungen eins zu eins importieren und verarbeiten. Und sie vergessen nicht. Zugegebenermaßen ist die Komplexität dieser Computer Tasks und deren Verarbeitung noch auf extrem niedrigerem Niveau. Die Fortschritte in dem Bereich sind aber beachtlich – unsere Erwartungen an Computertechnologie auch, btw.

1984

George Orwells 1984 wird in direktem Zusammenhang mit der allgegenwärtigen Verfügbarkeit von Daten und logischerweise mit dem Datenschutz in Verbindung gebracht. Ich denke es ist eine wichtige Novelle, weil sie viele Leute für Datenschutz-Problematiken sensibilisiert hat.

Auf der anderen Seite ist das dystopische Szenario des Buches so gar nicht Realität geworden. Natürlich wird abgehört, natürlich werden Daten missbräuchlich verwendet. Dass dies jedoch durch eine zentralistische, alles kontrollierende Kraft geschieht ist überhaupt nicht der Fall. Im Gegenteil, das Internet hat dafür gesorgt, dass jeder Einzelne mehr diverse Information zur Verfügung hat als je zuvor. Wir tun uns als Gesellschaft mit dem Umgang und der Bewertung dieser Informationen noch ein wenig schwer.

Knowledge wird intuitiv geteilt

Die Natur des Menschen ist jedoch, dass wir unser Wissen teilen. Das geschieht nicht per se immer, sondern situativ. Wir halten Wissen zurück, wenn wir uns einen gewissen Vorteil daraus erhoffen. Wir geben es frei, wenn wir merken, dass wir damit viel bewegen können. Und über kurz oder lang wird sämtliches Wissen verfügbar. Dass diese Entwicklung an Fahrt aufgenommen hat, verdanken wir, wie so vieles, dem Internet.

Es liegt aber auch einfach in der Natur, Wissen – je brisanter desto besser – zu teilen. Wir können nicht anders. Ich glaube, und das sage ich als Vertreter der Open-Kultur, dass sämtliches Wissen frei verfügbar sein sollte.

Und jetzt Datenschutz?

Um Machine-Learning Systeme weiter zu bringen, sind wir also auf möglichst viele Daten angewiesen. Der Datenschutz wurde in der Schweiz zum Beispiel Anfang der 70er Jahre thematisiert und dann 1992 als Gesetz verabschiedet. Während bei diesen Überlegungen, wohl auch ein wenig durch «1984» ein Daten-Missbrauch durch den Staat diskutiert wurde, liegt das Augenmerk heute eher auf den digitalen Branchenriesen «GAFKA». Interessant ist dazu der Longread aus 1975 in welchem der Stellenwert des Datenschutzes und die gesetzliche Einordnung diskutiert wurde.

In den letzten Jahren beobachte ich allerdings eine Übersensibilität in Sachen Datenschutz. Das hat zum einen mit der Sensibilisierung des Themas zu tun, auf der anderen Seite mit der technologischen Entwicklung mit der die Gesetzgebung nicht mithalten kann. Hier sind entsprechende Bestrebungen im Gang. Und das ist gut so.

Wem gehören Daten?

Eine zentrale Frage in dieser Debatte ist, wem Daten gehören. Intuitiv ist für uns, dass Erfahrungen welche wir gemacht haben uns selber gehören. Das gilt auch für Erfahrungen welche wir mit anderen Menschen gemacht haben. Wir geben diese Erfahrungen – ob sie jetzt gut oder schlecht sind – auch gerne und meist leichtfertig weiter. Wenn ich als derjenige mit dem die Erfahrungen gemacht wurden dabei gut wegkomme (z. Bsp. als Empfehlung) finde ich das gut. Wenn nicht, finde ich die Verbreitung dieser Information als unlauter.

Mit Daten ist es exakt dasselbe – außer, dass wir es persönlich komplett anders sehen. Wenn Firmen oder Institutionen Daten über uns erheben, sind die meisten Menschen nicht der Meinung, dass diese Daten auch diesen Firmen gehören. Wenn sie die Daten weitergeben und das zu unserem Vorteil ist, haben die allermeisten Menschen überhaupt keine Bedenken. Sobald diese Daten zu persönlichen Nachteilen führen, ist die Bestürzung und die Datenschutz-Bedenken groß.

Man muss den einzelnen vor systematischem Missbrauch schützen, ganz einfach, weil große Institutionen einzelne übervorteilen können. Die situative Bewertung aber ist weder logisch noch für die Gesellschaft längerfristig förderlich.

OpenData

Ich glaube wir müssen einen lockereren und entspannten Umgang mit Daten, auch persönlichen Daten, entwickeln. Dabei ist Datenschutz nicht mit Persönlichkeitsschutz zu verwechseln. Aber die Grenzen sind fein und fragil – und unterliegen dem Zahn der Zeit.

Im Manifest des Schweizer Vereins OpenData der eine Sektion der Open Knowledge Foundation ist, finden sich folgende Grundsätze:

Transparenz ist ein Mindeststandard. Nur zwingende Gründe wie der Persönlichkeitsschutz berechtigen zu Ausnahmen.

Die Informationsgesellschaft kann es sich nicht leisten, Innovationspotential schlummern zu lassen.

Zwar bezieht sich viel der Arbeit von Vertretern der OpenData-Bewegung auf den Staat, ich denke jedoch, dass wir dieselben Prinzipien auch auf den privaten Sektor anwenden müssen. Firmen müssen vermehrt beginnen Ihre Daten per APIs zu veröffentlichen. So kommt die gesamte westliche Gesellschaft weiter, weil wir plötzlich aus allen Erfahrungen lernen können. Und nur so werden wir Machine-Learning Technologie fundamental weiterbringen können ohne, dass gewisse Menschen oder Gruppen übervorteilt werden.

Artikel auf Social Media teilen:

Ein Kommentar zu Was Joghurt mit Datenschutz und Machine Learning zu tun hat.
  1. Jens Antworten

    Hi, ich lese heute einen Artikel nach dem nächsten auf Deiner Seite. Aber selten sehe ich Kommentare. Sind die alle böse und werden gelöscht? Sind Kommentare out? Schreiben Deine begeisterten Leser nur auf Twitter? An der Qualitaet kann es ja wohl nicht liegen, die ist Ordnung ;)

Schreibe einen Kommentar

Deine E-Mail Adresse wird nicht veröffentlicht. Bitte mache folgende Angaben: Dein Name, Deine E-Mail Adresse und Dein Kommentar.