> > http://www.dkriesel.com/spiegelmining > > > Seit Mitte 2014 habe ich mehr als 70.000 Artikel von SpiegelOnline > systematisch gespeichert. Jeden Tag kommen im Schnitt 100 dazu. Diese > Artikelmasse werden wir in der nächsten Zeit auswerten und erforschen. > Was herauskommt, ist eine tiefgreifende Analyse des > Publikationsverhaltens des vielleicht größten Meinungsmachers > Deutschlands. > > Ein kurzer Hintergrund: Was ist DataScience? > Die Methodiken des Datensatz-Erforschens heißen neudeutsch DataScience > und sind im Moment sehr gehypetes Gebiet im Umfeld der Informatik. Da > ich mich seit 2005 mit Machine Learning beschäftige, habe ich das schon > gemacht, bevor es cool war, und interessiere mich entsprechend dafür. > DataScience heißt, kreativ an einen zunächst unbekannten Datensatz > heranzugehen. Diesen erschließen, Wissen daraus erzeugen, verschiedenste > Auswertungen durchführen und die Ergebnisse so aufbereiten und > kommunizieren, dass sie auch jemand verstehen kann, der kein > Informatiker ist. Und vor allem: So dass auch jemand neue Aspekte, > Fragestellungen und Inspirationen beitragen kann, der kein Informatiker > ist. Visualisierungen sind dabei enorm wichtig – denn unsere Augen sind > die einzige echte Breitbandleitung zum Gehirn, die wir haben. Alles > andere ist Modemgeschwindigkeit. > DataScience ist vor allem auch: Kreativ Sachen aus Datensätzen > herauslesen, für die die Datensätze nie gedacht waren. Das ist die wahre > Kunst. Und die werden wir im Verlauf dieses und der nächsten Artikel > Hands-On lernen. > > http://www.dkriesel.com/blog/2016/0725_spiegelmining_analyse_70000_spiegelonline_artikel >
via > > http://de.groups.yahoo.com/group/clara-liste/ > bzw via a. -- rohrpost - deutschsprachige Liste zur Kultur digitaler Medien und Netze Archiv: http://www.nettime.org/rohrpost http://post.in-mind.de/pipermail/rohrpost/ Ent/Subskribieren: http://post.in-mind.de/cgi-bin/mailman/listinfo/rohrpost/