Mehrdeutiges in Schubladen packen

Cory Doctorow nimmt Netflix‘ Ankündigung, irgendwie automatisiert zu prüfen, ob ein Account außerhalb einer Familie geteilt wird – und vor allem das zu unterbinden – zum Anlass, aufzuzeigen, wie schwer bis unmöglich ist, überhaupt auf dem weißen Blatt Papier zu definieren, was eine Familie ist (was für ein Satz, bin außer Atem):

Netflix says that its new policy allows members of the same „household“ to share an account. This policy comes with an assumption: that there is a commonly understood, universal meaning of „household,“ and that software can determine who is and is not a member of your household.

Denn um Maschinen solche Kategorisierungen beibringen zu können, sollten sie möglichst klar abgrenzbar sein. Und nun ja, Familie ist das nur auf den ersten Blick. So wie viele andere Aspekte des sozialen Zusammenlebens ebenso. Doctorow verweist auf das wunderbare Repo, das ich schon mal vor einiger Zeit durchgearbeitet habe: A curated list of falsehoods programmers believe in. Wer einmal mit Adressen, und sei auch nur solche in Deutschland gearbeitet hat, kann ein Lied davon singen.

Doctorow erläutert das anhand seines Familiennames, der auf unterschiedlichste Weisen vom kyrillischen ins lateinische Alphabet überführt wurde:

In that list: names, time, currency, birthdays, timezones, email addresses, national borders, nations, biometrics, gender, language, alphabets, phone numbers, addresses, systems of measurement, and, of course, families. These categories are touchstones in our everyday life, and we think we know what they mean – but then we try to define them, and the list of exceptions spirals out into a hairy, fractal infinity. Historically, these fuzzy categorical edges didn’t matter so much, because they were usually interpreted by humans using common sense. My grandfather was born „Avrom Doctorovitch“ (or at least, that’s one way to transliterate his name, which was spelled in a different alphabet, but which was also transliterating his first name from yet another alphabet). When he came to Canada as a refugee, his surname was anglicized to „Doctorow.“ Other cousins are „Doctorov,“ „Doctoroff,“ and „Doktorovitch.“

Solche Mehrdeutigkeiten sind für Menschen klar zu erkennen, Maschinen sind sie nur sehr aufwendig oder kaum beizubringen:

For important categories, ambiguity is a feature, not a bug. The fact that you can write anything on an envelope (including a direction to deliver the letter to the granny flat over the garage, not the front door) means that we don’t have to define „address“ – we can leave it usefully hairy around the edges.

Wer Mehrdeutigkeiten in Schubladen packen will, bekommt also ein Problem. Das zeigte sich auch, ganz anderes Thema, aber derselbe Mechanismus, bei „sexueller Anzüglichkeit“. Mehrere Firmen bieten an, Bilder darauf zu prüfen und einen Wahrscheinlichkeitswert auszugeben. Bei BR Data haben wir diese Dienste untersucht und (1) finden einen Gender Bias und (2) deutlich abweichende Bewertungen für ein und dasselbe Bild, je nach Hersteller der Software.

Mehr dazu:

#

Schreibe einen Kommentar