• Anzeige

DC vermeiden, statt bekämpfen

Während meiner Laufbahn als SEO, hatte ich bis jetzt das große Glück von DC Seiten (duplicate content) verschont zu bleiben. Bis jetzt, denn die Seite, die mir jetzt vorgelegt wurde, ist DC in Vollendung. Aus diesem Grund möchte ich euch einige Punkte einmal genauer vorstellen und mit euch besprechen.

Tolle Inhalte aber kein Ranking

Als ich die Website das erste mal gesehen habe, dachte ich eigentlich, dass eine Optimierung sehr einfach wird. Die Inhalte sind ausführlich und liefern sogar Mehrwert. Von daher war ich verwirrt, als ich die Rankings sah. Die gesammte Domain mit weit über 300 Inhaltsseiten hat keine 10 Keywords mit der sie rankt.

Zunächst bin ich von einem Filter oder einem Penalty ausgegangen, doch in den Statistiken war nichts zu finden. Kein Abrutsch der Sichtbarkeit, gar nichts. Da ich wusste, dass die Seite kaum Backlinks hatte, habe ich langsam mit dessen Aufbau angefangen. Doch auch nach Wochen tat sich nichts.

Da ich bei meinem Blog regelmäßig einen Check bzgl. DC durchführe, habe ich dies irgendwann auch für die o. g. Seite gemacht und siehe da, das Problem war gefunden. Direkt auf der Startseite wurde DC gefunden. Bei einer tieferen Analyse musste ich feststellen, dass sogar über 60% der Seite von DC betroffen sind. Ob das vom damaligen Inhaber so gewollt war oder nicht, weiß ich nicht. Fakt ist, dass man jetzt handeln muss, denn ohne Behebung des Problems wird diese Seite niemals bei Google ranken.

Wie ermittelt man DC?

Ich habe irgendwann einmal gehört, dass man DC mithilfe von Google Webmaster Tools ermitteln kann. Leider habe ich keine entsprechende Anleitung gefunden. Mittlerweile glaube ich, dass es diese Funktion in WMT gar nicht mehr gibt. Wer mir dazu näheres sagen kann, bitte melden.

Deshalb habe ich mich für die Analyse mit Copyscape entschieden. Mit dem kostenlosen Online Tool kann man Seite für Seite in Ruhe durchgehen und einem wird gezeigt,  ob DC vorhanden ist oder nicht. Dabei berücksichtigt das Tool die eigene Domain sowie fremde Domains. Nach der Analysephase wirft das Tool dann eine Liste mit möglichen DC Fällen aus. Wie man in dem Screen sieht, wirft mir Copyscape auch für meine Startseite mögliche DCs aus. Jedoch handelt es sich bei keinem dieser Vorschläge um tatsächliche Fälle. Solche Fälle können zum Beispiel durch die Nutzung von Standardelementen in WordPress entstehen. Entdeckt man solche Textstücke, sollte man diese am besten entfernen oder austauschen.

Im Fall der untersuchten Domain hat mir Copyscape teilweise Seiten innerhalb der Domain gezeigt, die doppelte Inhalte enthielten, aber auch eine fremde Domain, die sich fleißig an den Inhalten bedient hatte. Dies ist wahrlich nicht schön zu sehen und viele würden bei dem Contentklau durch die Decke gehen. Da die Seite – wie bereits erwähnt – nur älteren Content besitzt, ist es mir im ersten Moment egal. Irgendwann wäre so oder so der Punkt gekommen, wo ich die Inhalte überarbeiten müsste 😉

1. Maßnahme gegen DC: alles neu

In unserem Fall hat man die Wahl, entweder man verklagt den anderen und hofft, dass er den geklauten Content rausnimmt, oder man erstellt neuen Content. Ich habe mich für den zweiten Weg entschieden, weil mir dieser erfolgsversprechender erscheint. Um der DC-Falle zu entgehen, werde ich nach und nach den ganzen Content anpassen. Natürlich ist dieser Weg zeitaufwändig, aber ich hoffe dadurch neue frische Inhalte zu haben, die ich mit zusätzlichen Mehrwerten versehen kann. Wenn alles gut läuft, werden die User und Google mir die Aufwand gleichermaßen danken.

Außerdem hat diese Variante noch einen weiteren Vorteil. Durch die neuen und aufgebesserten Inhalte merkt Google, dass sich an der Seite etwas tut. Die Seite wird damit zum Leben erweckt. Ziel ist es somit den sog. Freshness-Bonus von Google zu aktivieren und zumindest kurzfristig mit gewissen Seiten gut zu ranken.

2. Massnahme gegen DC: Canonical Tag

Viele Webseiten und vor allem Online-Shops leiden unter doppelten Inhalten. Diese entstehen in Shops sehr schnell durch ähnliche Produkte, z. B. hat das T-Shirt in gelb die gleiche Produktbeschreibung, wie das T-Shirt in rot. Damit Google weiß, welche Seite nun die relevantere ist, kann man den Canonical Tag nutzen. Dein Einsatz des Canonical Tags hatte ich ja bereits in dem namens gleichen Artikel „canonical“ beschrieben.

Quelle: wikipedia.org/wiki/Canonical_link_element

3. Massnahme gegen DC: Noindex, robots.txt & Co.

Wer erst gar nicht möchte, dass einige Seiten indexiert werden, kann auch den „Noindex“ nutzen, oder eine Seite (oder ganze Kategorien) mithilfe der robots.txt sperren. Während man beim Noindex den Hinweis direkt in der Seite einträgt,

  • <meta name=“robots“ content=“noindex“ />
  • <meta name=“googlebot“ content=“noindex“ />

wird der robots.txt Eintrag direkt in der dafür vorgesehen Datei abgelegt.

Manche Leute schlagen bei DC auch den Einsatz des nofollow-tags vor. Meiner Meinung nach ist dies wenig sinnvoll, weil man hier ja nur ein Signal für einen Link setzt und nicht für die Seite oder dessen Inhalt. Zudem ist hierbei nicht garantiert, dass Google die DC Seite nicht indexiert. Auf den Inhalt selbst hat er überhaupt keinen Einfluss.

4. Massnahme gegen DC: Fingerprints

Mit Fingerprints meine ich, dass man im Text einen Hinweis auf sich und seine Seite hinterlegen soll. Wenn dann ein anderer User auf die Idee kommt eure Inhalte zu klauen und sie 1:1 zu übernehmen, erhaltet ihr immerhin einen Link auf eure Seite. Dieser dient gleichzeitig als eine Art Quellenangabe. Da ich diese Methode selbst noch nie eingesetzt habe, kann ich leider nicht sagen, ob sie wirklich funktioniert. Wer hier mehr weiß, bitte melden 😉

5. Massnahme gegen DC: Bei Contentklau – Klage

Wer tatsächlich von Contentklau betroffen ist, der kann natürlich auch zur Klage greifen. Immerhin hat sich ein Fremder an den Inhalten bedient. Allerdings wird hier die Beweispflicht etwas schwierig. Denn wie soll man bitte beweisen, dass man selbst die Inhalte zu erst online hatte. Ein Zeitstempel kann schließlich verändert werden. Bevor ich mich überhaupt auf so etwas einlasse, würde ich erst einmal ein Beratungsgespräch mit meinem Anwalt führen, denn nur der hat den wirklichen Durchblick.

Fazit: DC von Anfang an vermeiden

Meine Empfehlung an dieser Stelle ist es den DC von vorne herein zu vermeiden. Wenn ihr merkt oder wisst, dass ihr grenzwertige Inhalte produziert / produzieren müsst, testet diese kurz mit Copyscape durch. So habt ihr wenigstens Gewissheit, ob tatsächlich DC vorhanden ist. Wenn ja, dann überlegt euch, ob ihr den Text nicht anders / unique gestallten könnt. Führt wirklich kein Weg daran vorbei, dann nutzt den Canonical Tag. Nach Setzung des Canonical Tags empfehle ich auch hier einen kurzen Testlauf, denn leider kommt es viel zu oft vor, dass der Tag falsch gesetzt wurde und deshalb die Seite nicht indexiert wird.

Gegen Contentklau kann man natürlich nur schwer vorbeugende Maßnahmen ergreifen. Allerdings kann man seine Seite regelmäßig überprüfen und wenn einem DC auffällt, kann man handeln. In welcher Art und Weise muss hier jeder für sich selbst entscheiden.

Nun zur interessanteren Frage: wie geht ihr eigentlich mit DC um und was kann man noch alles machen um ihn zu vermeiden?

3 Kommentare:

  1. Pingback:Week in Search Woche 8 SEO.SEM.GUERILLA.MARKETING.BLOG.SEONAUTEN

  2. Hi Sabrina,

    über die Google Webmaster-Tools kannst du keinen externen DC ermitteln. Die GWT können dir haben helfen internen DC zu finden. Unter dem Naviagtionspunkt „Optimierung“ –> „HTML Verbesserungen“ findest du Hinweise auf „Doppelte Metabeschreibungen“ und „Doppelte „title“-Tags“, sofern diese auf der Website vorliegen. Natürlich muss nicht immer DC bestehen, nur weil zwei oder mehrere Dokumente die gleichen Meta Descriptions oder Title-Tags haben. Es kann ja auch andere Gründe hierfür geben. Aber es lohnt sich zumindest mal nachzuschauen.

    Viele Grüße

    Daniel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.