SpiegelMining - Reverse Engineering von Spiegel-Online (33c3)

Share
Embed
  • Published on Dec 29, 2016
  • Wer denkt, Vorratsdatenspeicherungen und „Big Data“ sind harmlos, der kriegt hier eine Demo an Spiegel-Online.
    Seit Mitte 2014 hat David fast 100.000 Artikel von Spiegel-Online systematisch gespeichert. Diese Datenmasse wird er in einem bunten Vortrag vorstellen und erforschen.

    David Kriesel

Comments • 1 097

  • PresidentScrooge

    Tolle Datenauswertung. Leider hat es David verpasst bei den Kommentar-Sperrungen, Schlüsselwörtern und/oder politischen Themen (wie US-Wahlkampf) auch zu analysieren inwieweit Spiegel - bewusst oder unbewusst - politische Meinung macht.

  • Kondensat
    Kondensat Day ago

    51:44 ^^

  • Wertibus
    Wertibus Day ago

    ok jetzt passe ich immer auf meine gechner auf

  • Falcon109
    Falcon109 3 days ago

    Verdammt, ich hab ein Like hinterlassen... blöde Metadaten. ;) Ach... in diesem Fall: No risk, no fun.

  • MrZombiesplatter
    MrZombiesplatter 6 days ago

    DDoS auf die Bierbar. genial :D

  • sanakan
    sanakan 8 days ago

    top. raw data ftw.

  • Malte Thiessen
    Malte Thiessen 10 days ago

    Es krieselt im Spiegel

  • Dirkidirk Eckchen
    Dirkidirk Eckchen 11 days ago

    Der "Wruzzer" argumentiert ad hominem. Er hat halt keine Argumente, sondern versucht, gerade weil er keine Argumente hat, den Adressaten zu diskreditieren. Der " Wruzzer" outet sich durch sein Verhalten als intellektuell unredlich, als ungebildet.
    Der ™Wruzzer" ist ein Hetzer......

  • Paul Menden
    Paul Menden 14 days ago +1

    "Da glüht der Aluhut" I love it!!

  • Leotique
    Leotique 15 days ago

    Toller Typ

  • L ighty
    L ighty 16 days ago

    Super geiler Vortrag mit nem geilen Thema!

  • Daniel B
    Daniel B 16 days ago

    Der gute alte ddos auf die Bierbar

  • Skuamato
    Skuamato 17 days ago

    Okay, ich gebs ungern zu, aber bei den Fragen am Ende wurde es schwierig, mitzukommen. Man merkt, welche Art Publikum da war. Markov hatte ich in nem anderen Zusammenhang mal gehört, Monte Carlo kenn ich nur vom namen her etc.

  • Petersilius Zwackelmann

    Ihr wisst gar nicht, wie dankbar ich bin für diesen YT-Channel! 🙏

  • juwe
    juwe 18 days ago +1

    32:51 Halloween?!

    • s4ndwichMakeR
      s4ndwichMakeR 3 days ago

      Möglicherweise ein Bubble, der von zwei Nachbaren weit weg zusammengehalten wird und zufällig in der Mitte dort gelandet ist. In 3D könnte man das erkennen. Oder eine Art Pseudo-3D durch Immitation von Fokussierunschärfe wie beim Fotografieren. Sowas bietet Gephi aber nicht. :)

  • asdfghjkl
    asdfghjkl 19 days ago

    Das bedeutet jedoch auch, dass die dummen AfDler iim Grunde recht damit haben, wenn sie sagen, dass deutsche Medien eine bestimmte Politik vertreten, so zum Beispiel in bezug auf das Russenbashing.

    • Michael Renper
      Michael Renper 19 days ago +1

      Richtig, jedes Medium hat eine Tendenz, sollte(!) aber eine Kern an journalistisher Neutralität wahren. Bedauerlich ist, dass sich in den letzten Jahren "bubbles" gebildet haben, vor allem im linken Spektrum. Ich lese zwar immer noch den Spiegel-Online aber auch FAZ, NZZ, und die Sueddeutsche und gelegentlich Fokus (grauselig aber man will auch mal das wirklich konservative Spektrum hören).
      Die SuedDeutsche schneidet in Sachen Neutralität und Suchen der politischen Mitte am besten ab.
      Die NZZ hat dies sachlich besten Artikeln, auch zu Themen die man in Deutsche kaum noch sachlich diskutieren kann (siehe "Meine Oma ist ne alte Umweltsau").

  • Super Jetstream
    Super Jetstream 19 days ago

    das ganze geklatsche nervt so extrem

  • Zukasa [Steam]
    Zukasa [Steam] 19 days ago +4

    "Ich geh jetzt da raus zur nächsten Bierbar!"
    nice.

  • Marco
    Marco 20 days ago +6

    Er ist die cleverste und coolste Socke die ich kenne. Genial, einfach genial!

  • Cédric Le Gal
    Cédric Le Gal 20 days ago

    Wo kann ich den Link zu seinem Blog-Artikel bzgl. SpiegelPlus finden?

    • Cédric Le Gal
      Cédric Le Gal 18 days ago

      Hartmut Paul Danke - darauf wollte ich hinaus.

    • Hartmut Paul
      Hartmut Paul 18 days ago

      Hast Du die Blogs gelesen? In www.dkriesel.com/blog/2016/0904_spiegelmining_kassenartikel_privatartikel#readmore_blog_2016_0904_spiegelmining_kassenartikel_privatartikel wird darauf hingewiesen, ist aber mittlerweile nicht mehr da.

    • Cédric Le Gal
      Cédric Le Gal 19 days ago

      @Hartmut Paul Es geht mir um die Freischaltung der SpiegelPlus-Artikel. Geht das noch?

    • Hartmut Paul
      Hartmut Paul 19 days ago

      Giyf, aber ansonsten guggsdu hier:
      www.dkriesel.com/spiegelmining

  • UnicGames | Reviews & more

    Mal ne frage. Kann mir jemand sagen wie man sowas selbst machen könnte? Gerade mit dieser Visualisierung? Kenne nur C und etwas Java + html,css,php
    Wie wärs mit python?

    • UnicGames | Reviews & more
      UnicGames | Reviews & more 19 days ago

      @Michael Renper danke für die Antwort 🙏

    • Michael Renper
      Michael Renper 19 days ago

      "R" ist am einfachsten und im wissenschftlichen Umfeld am weitesten verbreitet. Inbesondere hat R eine integrierte Plotting Funktionalität. Erlaubt interaktive Auswertung mit ein paar Zeilen Code (wenn man die Lernkurve gemeistert hat).

  • gajustempus
    gajustempus 20 days ago +22

    "Im Osten ist es Blau..."

    I see what you did there...

  • bleed2blue1
    bleed2blue1 21 day ago

    57:09 Der Spiegel hat ein Problem wenn das gut funktioniert. Jemand der aus der vorhandenen Datenmasse eigene Artikel zusammenstellt, die eventuell nicht von einen Orginal zu unterscheiden sind erinnert mich an den erfundenen Bundestagsabgeordneten

  • Thomas Oeler
    Thomas Oeler 21 day ago +1

    Es ist krass, wie der Spiegel manipuliert und Meinungsmache betreibt. Aber typisch Lügenpresse Spiegelfresse

  • Jakob Wierzbowski
    Jakob Wierzbowski 21 day ago +2

    Einfach genial. Danke! Ohne Worte.

  • nomoretelekom
    nomoretelekom 22 days ago

    habe den vortrag gleich mal bei Facebook geteilt ;-)

  • Herrmann Hinz
    Herrmann Hinz 22 days ago

    das runterladen geht weiter. hihi

  • Mario Mueller
    Mario Mueller 22 days ago

    ...

  • George Orwell
    George Orwell 23 days ago +1

    Ein Fehler, russen bashen ist nicht ok, aber russlands trolle anschauen ist ok.

  • Chris Effpunkt
    Chris Effpunkt 24 days ago

    Was für Opfer sind eigentlich in diesem CCC. Wirkt als wäre der Großteil eregierter bei der berührung eines Commodore als von einer Frau. Und so sehen die Leute auch aus. Was dann noch zusätzlich aus den Fresslöchern dieser "Personen" kommt.. Ist das ne Parallelwelt neben unserer für kleine, hässliche Netzgnome? Und sich dann über das Mainstream RU-clip Verhalten von "normalos" echauffieren. Glückwunsch, Ihr habt die mit Abstand beschissenste Community, die mir auf RU-clip begenet ist, viel Spaß mit dieser ! :)

    • Michael Renper
      Michael Renper 19 days ago

      Was wollen Sie uns damit sagen? Wo echauffiert sich hier jemand? Unhöflich sind hier nur Sie.

  • Michael Hesz
    Michael Hesz 24 days ago +1

    Das ist eigentlich garnicht so lustig...

  • SSakv
    SSakv 25 days ago

    "So schnell diskutiert kein Mensch" wenn er das sagt meint er ja dass die ersten Kommentare mit Veroeffentlichung des Artikels freigeschaltet werden, also nicht von Lesern geschrieben werden.

    WTF Spiegel, aktiv verhindern das man Texte einfach den Autoren attributieren kann und auch sowas.

    Auch die Manipulation durch 'kommentierbarkeit' meh.

    • kurtilein3
      kurtilein3 25 days ago

      Hirnfurz detected, setzen sechs. Die Kürzel den Autoren zuzuordnen war trivial, und nein, Artikel die direkt ohne Kommentarfunktion online gehen haben keine Kommentare, denn es gibt keine Artikel mit deaktivierter Kommentierfunktion aber mit Kommentaren.

  • Krachen Ford
    Krachen Ford 28 days ago +1

    Sehr geehrter Herr Kriesel, danke für Ihre kluge Analyse, passen Sie auf sich auf und bleiben Sie gesund.

  • Versager TV
    Versager TV 29 days ago

    ich kann aber kein script schreiben

  • Kenichi Mori
    Kenichi Mori Month ago

    =3

  • Thomas L
    Thomas L Month ago

    spiegel online ist halt richtige propaganda maschine , naja wars schon immer

  • Liquicitizen Flo
    Liquicitizen Flo Month ago +1

    Danke! Großartige Arbeit! DIe Wahrheit muss ausgesprochen werden!

  • Flüssigschein
    Flüssigschein Month ago +1

    Vorglühen für Ende des Monats. :3

  • roflmao seinsohn
    roflmao seinsohn Month ago +5

    spiegelredakteure hassen diesen trick

  • crazy71achmed
    crazy71achmed Month ago +1

    Toller Vortag. Danke schön. Interessant und unterhaltsam. :)

  • Matthias Michael
    Matthias Michael Month ago

    das ist gut... um die eigenen.... messverfahren..... zu überprüfen!!!!!!

  • PH1LZ
    PH1LZ Month ago +1

    Türkei und ihre Demokratur :D

  • Carsten Aevermann
    Carsten Aevermann Month ago +1

    Oh jetzt glüht mein Aluhut auch.. :-) Cooler Vortrag, danke dafür.

  • GrafZahl
    GrafZahl Month ago

    270 Spigel Online Mitarbeiter gaben einen Daumen runter

  • Leon Nils Schmidt
    Leon Nils Schmidt 2 months ago

    Würde gerne wissen was Herr Krisel zu dem Thema mit dem Artikel heute sagt. Cambridge Analytica wurde ja wegen des Median Rummels und des Gerichtsverfahrens eingestellt. Allerding war die Story dahinter ja echt.

  • lu gas
    lu gas 2 months ago +1

    genuine vortrag

  • Thore Humml
    Thore Humml 2 months ago

    Überraschung! Ich komme aus dem Jahr 2019 und der Brexit ist noch nicht durch.

  • HERRMANN THE GERMAN
    HERRMANN THE GERMAN 2 months ago

    Der fetzt!

  • Hacks And Security - Concepts of Technology

    Here is the comment in english you are looking for :D

  • DomCaulfield
    DomCaulfield 2 months ago

    Vielen Dank für diesen Vortrag! Die Einblicke sind sehr interessant! Grüsse aus dem Ruhrpott!

  • wirelessmusic
    wirelessmusic 2 months ago

    Das sollte man mal mit google news artikeln probieren. Da würde der Aluhut schon verbrennen :D Big Data ist es noch nicht das sind Metadaten ist aber eine hinreichende Demo. Gephi ist ein schönes Tool auch mal Daten aus Twitter und Facebook topologisch zu visualisieren. Geänderte Artikel semantisch zu analysieren würde schon in die Richtung Big Data gehen. Interessant ist nicht welche Artikel erschienen sind, sondern von welchen Themen diese ablenken. Zum Beispiel Sport in Zeiten von irgendwelchen Kriesen wäre schon ein Schritt Richtung gezielter Ablenkung. Dönermodell? In der Mitte breit. An den Spitzen rund. Ich glaub das technische Vorgehen dahinter sollte mehr dokumentiert werden um dieses Vorgehen der breiten Masse mehr zugänglicher zu machen. In einem einzigen Vortrag würde es den Rahmen sprengen. Ja man initiert im Grunde die Downloads über einen Crawler der auf einem Server die Webartikel speichert. Dann kommt ein Satz aus Natural language processing - zum Beispiel werden Stoppwörter entfernt bzw markiert und die Wörter nach Häufigkeit sortiert - das ist der Rest dann einfach nur Abzählen was so ähnlich auch bei der statistischen maschinellen Übersetzung gemacht wird. Im Grunde hübscht dann Gephi diese Daten nach der Zahl der Features auf wobei man diese Aufteilung auch über die Kanten gewichten kann. Der Atlas 2 Algorithmus sortiert dann das Gesamtbild des Graphen. Dass manche Artikel nicht kommentierbar sind da braucht es nicht unbedingt großer Daten um das nachvollziehen zu können da reicht auch manchmal 'common sense'. Um die Daten von Spiegel online zu anonymisieren bräuchte man eine Art publishing Tool was eine Übersicht über die ganzen Artikel zu einem bestimmten Zeitintervall hat und Empfehlungen für die Reichweite aus alten Daten zieht bzw. die Artikel zu bestimmten Zeitplan veröffentlicht, so dass man weniger "persönliche" Daten und sexuelle Vorlieben aus den Metadaten analysieren kann.

  • schmatzek1
    schmatzek1 2 months ago +1

    Er ist total klasse. Erinnert mich ein wenig an Snowden.👍

  • DJ Savada
    DJ Savada 2 months ago

    Nach 3 jahren auf youtube endlich in meinem recomendet.........

  • Huri Think before
    Huri Think before 2 months ago

    Spiegel hat wohl noch nie in den Spiegem geschaut. War einst mal bei den seriösen Zeitschriften dabei.

  • Michael Nickname
    Michael Nickname 2 months ago

    Der Spiegel relotiuniert sich durch den Blätterwald....

  • TechLord
    TechLord 2 months ago

    Genau deshalb benutzt man *Zahlen* als Datum.

  • Lara Kibat
    Lara Kibat 3 months ago +2

    27:54 highlight xD

  • rigdigwus
    rigdigwus 3 months ago

    unglaublich was sich mit data mining anstellen lässt, wenn man jetzt noch alle anderen online zeitschriften dazu nimmt bekommt man ja eine unfassbar detaillierte Analyse

  • Unname Rmx
    Unname Rmx 3 months ago

    er ist ein guter referent