Daten sind das neue Öl: Hier tauchte der viel zu oft genutzte Satz das erste Mal auf

Ein Marketing-Mensch namens Clive Humby ist für die beliebte Bezeichnung verantwortlich. Damals, im November 2006:

Data is just like crude. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc to create a valuable entity that drives profitable activity; so must data be broken down, analyzed for it to have value.

Die gesammelten Quartz-Regeln zu y-Achsen

Eine der ersten Regeln bei Datenvisualisierungen: Die y-Achse vollständig angeben.

Wer die Regeln, darf sie auch brechen: Quartz erläutert, warum sie nicht immer die y-Achse bis zu 0 anzeigen

„Charts should convey information and make a point. We make charts to illustrate ideas that have context beyond their x- and y-axes. Forcing the y-axis to start at zero can do just as much to obscure and confuse the point as the opposite.“

(…)

First, this is why charts have scales. Blaming a chart’s creator for a reader who doesn’t look at clearly labeled axes is like blaming a supermarket for selling someone food he’s allergic to.

Second, the degree to which the chart emphasizes certain aspects of the data is a judgement of storytelling not chart-making. Sure, this mindset can yield misleading displays, but how is that different than words? Charts should be fair, not impartial.“

Zusammengefasst die fünf Quartz-Regeln zu y-Achsen:

  • Truncate the y-axis when small movements are important.
  • Truncate the y-axis when zero values are ridiculous.
  • Use a zeroed y-axis when it doesn’t matter.
  • Always use a zeroed y-axis with column and bar charts.
  • Never use a zeroed axis on a log scale.

via @a_sator

Leaflet.js: Regensburg und seine Migranten

Eine Karte, die den Anteil von Migranten an der Gesamtbevölkerung in Regensburg angibt. Dabei gelernt: Shapefile mit .csv-Datei mit QGIS mergen.

Ein bisschen mit Karten spielen Teil 2322: Dieses Mal mit Migranten in Regensburg.

Die Daten habe ich mit Tabula aus dem Vierteljahresbericht 2013 der Stadt Regensburg gescrapt. Sie waren die ersten, die Angaben zu Stadtteilen hatten und mir untergekommen sind. Die Geodaten der Stadtteile habe ich ebenfalls von offizieller Stelle.

In der Vergangenheit hatte ich immer das Problem, diese zwei Datensätze zusammenzufügen. Nachdem ich im letzten Wintersemester eine Vorlesung zu GIS belegt habe, war mir klar, dass das der way to go ist: Mit GIS-Software mergen – und nicht in der Kommandozeile, so wie ich das vor etwa einem Jahr probiert hatte. Das Ende vom Lied waren zwei neue Benutzer auf meinem Computer. Das passiert, wenn man Copy-Pasted und keine Ahnung hat davon …

Also: Wie Geodaten, zum Beispiel eine im Geojson-Format und eine csv-Datei zusammenfügen? Mit der Open-Source-Software QGIS. In der Uni haben wir ArcGIS benutzt, aber QGIS ist dem sehr, sehr ähnlich.

Aber dabei gibt es ein Problem: Alle Einträge der csv-Datei sind automatisch Strings. Es gibt aber einen Weg, das zu verhindern. Dazu muss man eine zweite Datei erstellen, die denselben Namen wie die .csv-Datei trägt, jedoch mit der Endlung .csvt. In diese .csvt-Datei werden dann in einer Zeile die Datentypen notiert. Zum Beispiel:

"string", "integer", "real"

Danach muss die Datei über Layer –> Delimited Tab Layer importiert werden. Dadurch werden die Datentypen automatisch erkannt, solange die .csv und .csvt-Datei den gleichen Namen haben und im gleichen Ordner liegen.

Andere Varianten, um die .csv-Datei in QGIS zu laden, wie einfach reinziehen oder als Vector Layer zu laden, haben bei immer dazu geführt, dass alle Datenpunkte wieder Strings waren.

Wo waren wir? Wir haben eine Datensatz mit passenden Datentypen und die Geodaten zusammengeführt. Diese kann nun exportiert werden und dann als Geojson-Datei zum Beispiel in Leaflet weiterverarbeitet werden.

Doch halt! So leicht ging es nicht. Die direkt aus QGIS exportierte Datei wurde bei mir über Leaflet nicht ausgespielt. Erst wenn ich sie bei CartoDB hochgeladen und wieder exportiert habe, hat es funktioniert. Weiß der Geier, warum.

Das Ergebnis: Eine Karte mit Leaflet. Für die Klassifizierung, Infobox und Legende habe ich das Leaflet-Tutorial benutzt.

Und nun? So ganz ohne Kontext ist das ein bisschen langweilig. Deshalb habe ich mir überlegt, Texte zum Thema von der Mittelbayerischen Zeitung und Regensburg Digital einfließen zu lassen. Doch: Bei beiden Medien ist nicht möglich, Artikel zu diesem Thema einigermaßen automatisiert, z.B. via Feed, auszulesen. Bei Regensburg-Digital finde ich zum Beispiel nur das Schlagwort „Flüchtlinge“, bei der Mittelbayerischen gar keine Tags. Über einen Alert bei Google News würde zu viel Unpassendes mitgeschwemmt und für eine händische Auswahl, die in zwei Tagen wieder obsolet wäre, fehlt mir die Motivation. Dann eben nur die Karte.

Können Startups den Journalismus in der digitalen Welt neu erfinden?

Die Debatte um die Zukunft des Journalismus ist eine, die in Technologie-Zyklen gerechnet bereits eine halbe Ewigkeit dauert.

Die Debatte um die Zukunft des Journalismus ist eine, die in Technologie-Zyklen gerechnet bereits eine halbe Ewigkeit dauert. Als Konsens gilt: Leser sind durchaus bereit, zumindest geringe Beträge für besondere Stücke oder für das Vertrauen in eine Publikation zu zahlen. Die reine Information dagegen bleibt kostenlos. Werbung funktioniert nur ab einer kritischen Masse oder einer spitzen Zielgruppe als Erlösmodell. Deshalb ist es unausweichlich: Zumindest ein Teil der Leser muss im Internet zahlen. Auch wenn Vertreter der deutschen Verlage an der Diskussion zum digitalen Journalismus seit Jahren teilnehmen: Umgesetzt haben sie bisher keine der Kernforderungen – und lassen damit Platz für Startups, um den Journalismus in der digitalen Welt neu zu erfinden.

Es ist ein offenes Geheimnis: Die deutschen Nachrichtenportale wollen eine Paywall. Bis jetzt können sie sich aber aus dem Gefangenendilemma nicht befreien: Niemand fängt an, aus Angst, die anderen Portale könnten doch weiterhin kostenlos bleiben und dann Traffic abgreifen. In der Niederlanden konnte dieses Problem ein Startup lösen: Der Aggregator Blendle wird als iTunes für journalistische Güter gehandelt, weil Artikel verschiedenster Verlage dort zu günstigen Preisen erworben werden können. Natürlich kann man auch auf deutschen Nachrichtenportalen ein E-Paper beziehen – jedoch nicht auf einer zentralen Plattform und immer als ganze Ausgabe wie in der Offline-Welt. Der Journalist Richard Gutjahr gehört zu denen, die bereits seit Jahren fordern, dass Verlage diese Bündelung auflösen müssen. Es ist ist bezeichnend, dass ausgerechnet er beim Münchner Startup LaterPay als Berater tätig ist. LaterPay will Micropayment userfreundlich in Online-Publikationen einbinden. Es wird sich in den kommenden Monaten zeigen, ob Konzept des digitalen Bierdeckels die Vorschusslorbeeren wert ist. LaterPay ist ein Beispiel dafür, dass Startups nicht rein journalistisch arbeiten müssen, um Auswirkung auf den Journalismus im Netz zu haben.

Die lausigen Pennies des Micropayments sind für zeitaufwendigen Journalismus, der eine Vorabfinanzierung braucht, nicht die richtige Methode. Der Sportteil habe schon immer das Politikressort querfinanziert, heißt es dann oft. Was aber ist, wenn es keinen metaphorischen Sportteil gibt? Crowdfunding kann die Lösung sein. Leser können konkret Recherchen unterstützen, erst wenn die benötigte Summe tatsächlich gesammelt wurde, bekommen Journalisten das Geld ausbezahlt. Die deutsche Plattform dafür heißt Krautreporter. Startups spielen dabei gleich auf zwei Arten eine Rolle: Zum einen durch die Plattform an sich, zum anderen durch die Journalisten, Coder oder Grafiker, die sich im Stile von Entrepreneuren selbst um die Finanzierung ihrer Projekte kümmern.

Doch die vielleicht wichtigste Triebfeder für Startups sind die schlechten Arbeitsbedingungen. Die wiederkehrenden Kämpfe zwischen Print und Online – zuletzt in der Debatte um den Aufstieg Stefan Plöchingers in die Chefredaktion der Süddeutschen Zeitung – drehen sich auch darum, dass der Arbeitsalltag vieler Online-Journalisten mehr Content Management als Content Creation ist. Viele dürfen nicht so, wie sie wollen. Online zählt vor allem Quantität, um die Klickzahlen und Werbeeinnahmen hochzutreiben. Wer an vorderster Innovationsfront dabei sein will, ist fast gezwungen, das außerhalb traditioneller Verlagshäuser zu tun. Aus einer solchen Enttäuschung heraus ist eines der beeindruckendsten neuen Magazine im deutschsprachigen Raum entstanden: das österreichische paroli. Technisch ehrgeizig befasst sich paroli mit Politik, Gesellschaft, Kultur. Man merkt es dem individuellen Stil des Magazins an, dass von Anfang an Webentwickler mit im Team waren. Mit Kopf oder Zahl hat paroli auch das Werkzeug des Crowdfundings erfolgreich ausprobiert. Das Ergebnis: Eine interaktive Webdokumentation über die Lebenswirklichkeit junger Europäer. Das Lokalblog Da Hog’n aus dem Bayerischen Wald hat sich aus ähnlichen Gründen wie paroli gegründet: Journalisten, die mit der Berichterstattung der Monopolzeitung nicht zufrieden waren, feiern bald den zweiten Geburtstag. Die Finanzierung erfolgt über eine Mischkalkulation: Anzeigen, auch native Advertising, und – in geringerem Maße – Unterstützung durch Leser.

Eine Musterlösung gegen den Preisverfall im digitalen Journalismus haben auch Startups bisher noch nicht gefunden, aber sie sind durch geringe Fixkosten agil genug, um neue Wege auszuprobieren. Der Risikokapitalgeber Marc Andreessen ist optimistisch – auch berufsbedingt durch Investitionen u.a. in das US-Magazin PandoDaily: Er glaubt daran, dass die Preise nahe Null von einem größer werdenden Markt für Nachrichten aufgefangen werden. Behält Andreessen recht, heißt das: Noch mehr Platz für journalistische Startups, als den Raum, den ihnen festgefahrene Verlage sowieso schon lassen.

Diesen Text habe ich beim Essay-Wettbewerb des Meedia-Magazins eingereicht, um am Innovation Field Trip teilzunehmen. Das hat nicht geklappt, Chefredakteur Christian Meier teilte mir mit, ich sei unter den Top 3 gewesen. Die Gewinnern ist Karolin Freiberger

Dieser Tage läuft der fünftägige Innovation Field Trip, bisherige Berichte darüber:

Making-Of beim Datenjournalismus: Geocoding im Lokalen

Eigentlich war ich im November mit der Karte für die Bürgermeisterkandidaten im Landkreis Freyung-Grafenau fertig. Die Bilder und Namen erscheinen, die Gemeindegrenzen nicht erkennbar und eine Version für die gesamte Breite auf der Hogn.de-Webseite ist möglich.

Heute im Februar, vier Wochen vor den bayerischen Kommunalwahlen, ging mit der Karte der Bürgermeister-Kandidaten im Landkreis endlich mein erstes Datenjournalismusprojekt online, das eine Auftragsarbeit war. Die Resonanz, gemessen als Facebook-Shares, ist bisher noch, sagen wir, verhalten.

Fünf Gedanken: „Making-Of beim Datenjournalismus: Geocoding im Lokalen“ weiterlesen