Facebook-Vorschaubild-Abmahnung aus technischer Sicht

      ca. 3 Minuten Lesezeit  

Ach herrje, es gibt wieder eine Sau, die durch’s Dorf getrieben wird: “Nun ist es soweit: Abmahnung wegen Vorschaubildern bei Facebooks Teilen-Funktion”

Nun laufen alle Leute los und behaupten: “Ihr müsst ab sofort alle Links ohne Vorschaubild posten!” Aus meiner Sicht ist das der total falsche Ansatz, aber darüber dürfen sich die Anwälte Gedanken machen.

Ich hab dazu auch bei Nina Diercks kurz mal Rede und Antwort gestanden, was man da technisch machen kann und will das hier nochmal kurz näher erläutern, wie das eigentlich geht, wenn ich einen Artikel verlinke.

  1. Ich poste den Link zur externen Seite bei Facebook (das Nachfolgende kann auch auf Google+ angewandt werden)
  2. Facebook schaut in seinem Cache, ob es die Seite in den letzten 24-48 Stunden schon mal gesehen hat und nimmt die Informationen für die Darstellung - wenn keine Informationen gefunden wurden
  3. Facebook lädt den Quelltext der Page herunter, die da verlinkt wird (kann es das nicht, wird auch nix ausgewertet) und schaut, ob es OpenGraph-Informationen findet (dazu gleich mehr) - wenn keine Informationen gefunden wurden
  4. Facebook schaut im Quelltext nach HTML <img>-Tags für die Bilder sowie den ersten textlichen Inhaltspassagen und einem <title>-Tag für den Namen der Seite und benutzt diese (gibt es keine Informationen, wird nur noch die Link-URL angezeigt)

Hat Facebook jetzt diese Daten geladen (anders lädt ein Browser die Daten ja auch nicht), werden diese Inhalte zwischengespeichert, damit die Website, die von 100.000 Leuten verlinkt wird, nicht an der Überlast nur durch die Facebook-Anfragen stirbt.

Diese oben genannten OpenGraph-Informationen kann jetzt ein Webseitenbetreiber, der nicht möchte, dass die Vorschaubilder auf Facebook gezeigt werden benutzen, um sich simpel davor zu schützen. Hier mal ein kleines Beispiel, womit ich auch für diese Seite das Vorschaubild verhindere:
<meta property="og:image" content="http://www.example.com/images/blank.gif">

Was habe ich hier gemacht? Ich habe ein Meta-Tag zur Seite hinzugefügt. Diese werden dem normalen User im Browser nicht angezeigt, aber eben für Crawler verwendet, um die Informationen semantisch zu beschreiben.
Dieser hier dargestellte Schnipsel sagt also: Das Bild für OpenGraph-Abfragen hol dir von http://www.example.com/images/blank.gif. Hier kann man jetzt eine URL angeben, die nicht existiert, denn sobald Facebook einen 404-Fehler (Seite nicht gefunden) zurückbekommt, wird das Bild nicht angezeigt. Hier sollte man jetzt nicht unbedingt mein Beispiel nehmen, da die example.com keinen 404-Fehler zurückwirft. Es handelt sich um ein Beispiel. Auch sollte man die unzählichen 404-Fehler nur auf seiner eigenen Domain produzieren und keine fremden URLs benutzen, da dies zu Mehrlast auf fremden Servern führt.

Noch besser wäre es natürlich, wenn man, wenn schon kein Vorschaubild des Inhalts genommen werden soll, hier zumindest ein Logo der Website einbindet. Dann generiert man trotzdem Klicks auf die eigene Website durch die ansprechendere Darstellung. Was soll eine Website, wenn man keine Besucher darauf haben möchte? Und ein guter, beschreibender Text sollte auch dabei sein, was man sich auf der OpenGraph-Website genauer anschauen kann, wie man was machen muss.

Für die meisten Blogsysteme gibt es schon fertige Plugins, die dies bereits abdecken.

Was ich persönlich ganz gut fänd, wäre, wenn Facebook die robots.txt benutzen würde, um Verzeichnisse, die nicht indexiert werden dürfen, genauso auch für die Bilder zu verwenden, wie es Google & Co. als Suchmaschinen tun. Nur kann ich aus Administratorsicht auch widerum verstehen, wenn Facebook den Mehraufwand an Traffic und Rechenzeit nicht investieren will.