Lesenswertes: Big Data und Big Algorithmen

Wenn Daten sprechen

Big Data, Big Data, Big Data. Der Begriff flutet die Debatten um die digitale Zukunft. Aber was sind das eigentlich, diese großen Daten? Bernd Graff von der SZ vergleicht den Status Quo mit dem Mittelalter, als Karl der Große mit Erdöl konfrontiert war.

Der Buzz um Big Data ist also erst einmal schiere Verzweiflung an der großen Zahl, verkauft als Freude. Es ist das ungläubige Staunen auch darüber, dass sich die Serverfarmen mit ihren riesigen Daten-Reservoirs wie von selbst füllen. Angeblich verdoppelt sich das Gesamt-Datenvolumen alle zwei Jahre. Das Heu ist also da, aber man will die Stecknadeln darin.

 

How algorithms shape our world

Ein Video, das meiner Meinung nach zu den Best-of TED-Videos gehört:

via

Gephi: Netzwerk bei Facebook visualisieren

Spielen am ersten Tag des neuen Jahres: Mein soziales Netzwerk bei Facebook. Voilà:

facebook networkwhite

Die Grafik habe ich mit Gephi erstellt, einem Open-Source-Programm, um Netzwerke zu visualisieren.

Erkennbar ist: Es gibt drei Zentren bzw. Subnetzwerke innerhalb meiner Freunde: Schule, Familie und Studium, in denen sich die Leute auch untereinander kennen. Daneben ein paar Grüppchen oder einzelne Menschen. So weit so wenig überraschend.

Die ersten Schritte mit Gephi sind nicht schwer, auch dank einem guten Einführungstutorial, auch wenn klar ist, dass das Programm viel mehr kann als sich zum Beispiel ein paar Cluster ausgeben zu lassen. Man kann Filter drüber legen, sich statistische Werte ausgeben lassen …

An die eigenen Facebook-Daten kommt man über eine App namens Netvizz. Man kann sich dort eine Datei mit den eigenen Freunden, deren angegebenes Geschlecht und Region (Deutschland, USA etc) runterladen. Optional kann man sich auch Gruppen oder Seiten, die einem gefallen und deren Posts holen, was aber schon eine Weile dauert – und ich deshalb abgebrochen habe. Auch weil ich diese Daten ja eigentlich auch gar nicht brauche.

Nachdem ich mir meine Daten heruntergeladen habe, habe ich mich an ein Tutorial gehalten: Getting Started With The Gephi Network Visualisation App – My Facebook Network, Part I. Insgesamt gibt es vier Teile (Teil 2, Teil 3, Teil 4), wobei der dritte Teil eigentlich obsolet ist, denn Teil 4 zeigt eine bessere Methode für das Clustering als die im dritten Teil vorgestellte Art.

Aufmerksam wurde ich auf Gephi durch “Die 250 meistgenannten Personen 2012” im Open Data Blog von Zeit Online.