Zwei Gründe, warum die Prognosen zur US-Wahl das ganz große Bashing nicht verdient haben

Die Meinungsforscher lagen falsch. Das war Konsens nach der US-Wahl. Und ja es stimmt, Fivethirtyeight, NYTimes, Pollyvote und eine Reihe anderer hielten einen Sieg Hillary Clintons wahrscheinlicher als einen Sieg von Donald Trump.

Doch so katastrophal war das Abschneiden nicht. Aus zwei Gründen.

1. Das Wörtchen wahrscheinlich

Die Berechnungen sagten nie: Hillary gewinnt. Oder Trump gewinnt. Sondern: Mit einer Wahrscheinlichkeit von, sagen wir 80 Prozent, gewinnt Clinton.

80 Prozent klingt hoch, nah an der 100, also kann ich mich beruhigt hinter meinem Smartphone zurücklehnen. Bauen wohl doch keinen Scheiss, diese Amerikaner. Die 20 Prozent Unsicherheit sind dann schnell ignoriert. Vor allem dann, wenn mir die 80 Prozent in den Kram passen. Psychologen nennen das Confirmation Bias.

Deutlicher wird der unsichere Part, wenn man die 80 Prozent als sogenannte Quote darstellt. Das bekannteste Beispiel ist die 1:1-Chance, also dann, wenn Clinton und Trump jeweils eine 50-prozentige Siegwahrscheinlichkeit zugesprochen wird.

Eine 80-Prozent-Siegchance bedeutet eine Quote von 4:1. Klingt nicht mehr ganz so optimistisch. Zum Vergleich: Beim Würfel eine Eins zu bekommen hat die Quote 1:5.

Und selbst bei Unsicherheiten im sehr niedrigen Bereich, kann die Wahrscheinlichkeit dem Wunsch ein Schnippchen schlagen. „Schwarzer Schwan“ nennt das Nassim Nicholas Taleb.

2. Umfrageergebnisse sind nicht fix

Die Prognosen basieren alle auf einzelnen Umfragen. Und jede einzelne gibt zwar einen konkreten Wert an, wie 51 Prozent für Clinton und 47 Prozent für Trump, meint aber eigentlich eine Spanne, in der das Umfrageergebnis liegt. Das würde dann in diesem fiktiven Beispiel bedeuten, dass zu 95 Prozent zwischen 55 und 47 Prozent der Befragten Clinton wählen würden und zwischen 51 und 43 Prozent Trump.

Das zeigt zweierlei: Erstens geben die Werte eigentlich einen Bereich an. Und zweitens können sich diese Bereiche von Clinton und Trump überschneiden.

Quartz schreibt dazu im Text The polls didn’t fail. We just chose to ignore the math:

„Forecasting is as much art as science, and not just in elections, because every moment in history is uniquely different. This flexibility makes it easy to fool ourselves, like everything else, we see what we want to see. A margin of error is built into polls because despite the analysis, unseen factors can introduce mistakes. Next time you see a difference between predictions, ask how big it really is, and ask why“

Links:

Not all forecasters got it wrong: Nate Silver does it again (again)

Die Probleme einzelner Meinungsumfragen (nicht die Berechnung mit aggregierten Daten, von denen ich im Post spreche)

 

Wie ungleich hätten Sie’s denn gern?

Makronom über verschiedene Wege Ungleichheit zu messen: Die nächste Stufe der Ungleichheitsmessung

  1. die horizontale Ungleichheit,
  2. die Mittelschicht und die Verteilung von Einkommen mit Ausnahme der Spitzengruppe
  3. und die Spitzengruppe der Einkommensverteilung.

Diese Entwicklung korrespondiert mit der Entwicklung der gesellschaftlichen Interessen: Von der Frage, wie ein typischer Arbeiter im Vergleich zu einem typischen Bauern abschneidet, über die Frage, wie ungleich eine Gesellschaft und wie groß die Mittelschicht ist, hin zu der Frage, wie reich die obersten 1% sind.

Jetzt, nicht zuletzt durch Piketty:

  • allgemeine Verteilung, die z.B. Gini-Koeffizient zeigt, ist out
  • jetzt im Trend: Anteil der Spitzenverdiener mit Hilfe von Steuerdaten (anstatt Haushaltsbefragungen, die i.d.R. Reiche unterschätzen)

Probleme mit Steuerdaten:

  • jeder hat Anreiz seine Steuerlast zu minimieren
  • gerade sehr reiche Menschen verstecken nicht selten ihr Vermögen

Snippets aus einem Text zu Social Media

Upload Complete – Platforms and the insourcing of the media, The Awl

Elementarer Unterschied zwischen Instagram und Snapchat auf der einen und Facebook und Twitter auf der anderen Seit: Bei Instagram und Snapchat werden eigene Inhalte geteilt, bei Facebook und Twitter i.d.R. auf fremde Inhalte verlinkt.

Andere Gedanken aus dem Text:

A feed, then, was a mixture of personal posts and pitches to look at other things. It was an endless stream of captions contextualizing a Great Big Outside. But each year the feeds got richer. The captions expanded into previews. The previews expanded into full photos, videos and posts. The remaining links underneath came to resemble vestigial metadata. This was easy to notice from the outside, from the perspective of, say, a publisher, for whom change was reflected in referrals and traffic. For users, the change happened gradually and subtly, over the course of a million consecutive pulls to refresh.

Understood from perspective of the web, the last five years have represented a sort of tragedy of the commons. The platforms grew big and strong. Websites and publishers catered to the needs of those platforms, vague worries about control and identity set aside for the necessary pursuit of audience in an unpredictable environment. Nobody did anything wrong, exactly, and it’s not clear what they should have done differently. Some publications that functioned well under the referral regime will struggle under platforms. Others might succeed, more might materialize out of the Venture Ether. Yet others will chase new things, and many more will just continue to try everything.

Daten sind das neue Öl: Hier tauchte der viel zu oft genutzte Satz das erste Mal auf

Ein Marketing-Mensch namens Clive Humby ist für die beliebte Bezeichnung verantwortlich. Damals, im November 2006:

Data is just like crude. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc to create a valuable entity that drives profitable activity; so must data be broken down, analyzed for it to have value.

Auf dem Mac mit Automator einen E-Mail-Anhang automatisch in einem Ordner speichern

Total hypothetisches Szenario: Eine Firma schickt ihre Rechnungen regelmäßig per Mail. Ich möchte die Rechnungen, die als pdf angehängt sind, gerne in einem Ordner speichern.

Wie geht’s? Mit Automator, einem OS X-inklusiven Tool, mit denen solche Workflows erstellt werden können.

Über Spotlight den Automator öffnen. Die Abfrage betrifft Mac Mail, also links Mail auswählen. Via Doppelklick oder Rüberziehen können einzelne Schritte aneinandergereiht werden.

Die Abfrage lautet dann:

  1. E-Mails suchen nach den eigenen Bedingungen, z.B. Anhand der Mail-Adresse oder des Betreffs
  2. Ausgewählte E-Mails abfragen: Ein wichtiger Schritt, damit werden die vorher ausgesuchten Mails an den dritten Schritt übergeben
  3. E-Mail-Anhänge sichern. Ordner auswählen. Fertig.
  4. Das Automator-Skript speichern.

Total hypothetisch sendet die Firma aber nicht nur ihre Rechnung als pdf, sondern auch jede Menge Crap in der Mail mit: Bilder etc. Auch diese Anhänge werden gespeichert. Um sie zu entfernen braucht es zwei weitere Schritte:

  1. Finder-Objekte suchen: Im betreffenden Ordner auswählen, die benötige Dateiendung (Dateisuffix) auswählen.
  2. Finder-Objekte in den Papierkorb legen: Die ausgewählten Dateien, wie alle, die nicht pdfs sind, werden gelöscht.
  3. Das Automator-Skript speichern.

Total hypothetisch schickt mir die Firma jeden Monat eine Rechnung. Mit Hilfe des Kalenders kann ich diese Abfrage jeden Monat automatisch durchführen. Das geht so:

  1. Neues Ereignis erstellen.
  2. In gewünschtem Rhythmus wiederholen lassen.
  3. Bei Warnhinweis „Eigene“ auswählen, dann „Datei öffnen“ und das gespeicherte Automator-Skript wählen.

Total hypothetisch funktioniert’s dann.

Die gesammelten Quartz-Regeln zu y-Achsen

Eine der ersten Regeln bei Datenvisualisierungen: Die y-Achse vollständig angeben.

Wer die Regeln, darf sie auch brechen: Quartz erläutert, warum sie nicht immer die y-Achse bis zu 0 anzeigen

„Charts should convey information and make a point. We make charts to illustrate ideas that have context beyond their x- and y-axes. Forcing the y-axis to start at zero can do just as much to obscure and confuse the point as the opposite.“

(…)

First, this is why charts have scales. Blaming a chart’s creator for a reader who doesn’t look at clearly labeled axes is like blaming a supermarket for selling someone food he’s allergic to.

Second, the degree to which the chart emphasizes certain aspects of the data is a judgement of storytelling not chart-making. Sure, this mindset can yield misleading displays, but how is that different than words? Charts should be fair, not impartial.“

Zusammengefasst die fünf Quartz-Regeln zu y-Achsen:

  • Truncate the y-axis when small movements are important.
  • Truncate the y-axis when zero values are ridiculous.
  • Use a zeroed y-axis when it doesn’t matter.
  • Always use a zeroed y-axis with column and bar charts.
  • Never use a zeroed axis on a log scale.

via @a_sator

Lesenswertes: Code und Drohnen beim Bund

How Fusion does agile

Once your communication is like oxygen, agile goes best with a heavy dose of open source software.

Daniel Bachhuber, einer der prominentesten WordPress-Entwickler und ehemaliger Automattic-Angesteller, ist seit Kurzem bei Fusion. Dort leitet er die Entwicklungsabteilung. Fusion ist einer der neuen Player auf dem Medienmarkt, der sich mir vor allem bemerkbar gemacht hast, weil er prominente Köpfe abgeworben hat. Unter anderem Alexis Madigal vom Atlantic, Felix Salmon von Reuters und eben Daniel Bachhuber von Automattic.

Coding History

Genauer gesagt ist Coding History hörenswert. Die Selbstbeschreibung:

Ein Podcast zur Frage, wie die digitale Welt geworden ist, wie sie ist: Warum sieht Software so aus, wie sie aussieht? Wie hat sich das Programmieren von Software verändert und was für Auswirkungen hat das eigentlich darauf, wie wir Software benutzen?

„Ich bin kein Computerspieler“

Wie sieht die Arbeit von Drohnenpiloten bei der Bundeswehr aus? Wirklich interessantes Interview bei Zeit Online.

Die 90er-Jahre-Technologie-Party

Welcome to the Revenge of ’90s Internet

The Verge vergleicht die großen der Technologie-Industrie – Google, Facebook und den Chip-Hersteller Qualcomm – mit den dominanten Firmen der 90er Jahre:

You can keep going: Facebook is now pitching itself to media companies as their savior, just as AOL once did. Most websites get a tremendous amount of traffic from Facebook; it’s only a matter of time before Facebook starts aggressively charging for that traffic.

Google = Microsoft
Facebook = AOL
Apple = Sony
Buzzfeed = Yahoo

Die Begründungen dazu nach dem Link

Leaflet.js-Macher Vladimir Agafonkin: „hey front-end guy! make a map“

Leaflet.js-Entwickler Vladimir Agafonkin plädiert auf einer Open-Souce-Mapping-Konferenz (puh!) für Einfachheit, „Simplicity“.

Zur Zeit findet die FOSS4G statt: Ein Treffen von Leuten, die mit Karten und Geoinformationssystemen auf Open Source Basis arbeiten:

The annual FOSS4G conference is the largest global gathering focused on open source geospatial software. FOSS4G brings together developers, users, decision-makers and observers from a broad spectrum of organizations and fields of operation.

Gestern hat dort Vladimir Agafonkin, der Entwickler von Leaflet.js einen Vortrag gehalten. Der Titel: „How Simplicity Will Save GIS„.

Er erzählt darin, wie er als 22-Jähriger ohne viel Ahnung von Geoinformationssystemen, kurz GIS, mit Leaflet angefangen hat: „Born as a protest against bloat, clutter and complexity.“

Ab der Hälfte der Folien, bekommt man den Eindruck, dass Agafonkin eine Motivationsrede gehalten haben musste. Ein schlauer Spruch nach dem anderen, aber nicht uninteressant.

Heute und morgen gibt es Livestreams von FOSS4G, gegen 17 Uhr deutscher Zeit geht’s los.

Gibt es einen Unterschied zwischen simplicity und minimalism?

Although I sometimes use the terms ‘minimal’ and ‘simple’ as if they were interchangeable, by definition, minimalism actually refers to the paring down of elements to get to the essence of a thing. This doesn’t mean you practise minimalist design simply by removing ornamentation; it means you ensure that every part of the design works together to the point where nothing else can be added or removed to improve it. It’s not easy to do well

Aus: Five killer ways to use minimalism