Duplicate Content

Zu den Lieblingswörtern jedes SEOs gehört „Duplicate Content“ und über das Thema wurde bereits vieles geschrieben. Doch was versteht man unter diesem Schreckgespenst jedes Webmasters und wie wirkt sich Duplicate Content, also doppelte Inhalte, aus?

Was ist Duplicate Content?

Von Duplicate Content, abgekürzt mit DC, wird gesprochen, wenn exakt derselbe oder auch ein sehr ähnlicher Inhalt („Near Duplicate Content“) unter verschiedenen Webadressen hinweg zur Verfügung steht. Dies kann entweder domainintern sein oder über Domaingrenzen hinweg. Bei letzterem Fall muss zwischen eigenen Domains und fremden Domains unterschieden werden.

Für Suchmaschinen ist jede URL erstmal einzigartig und kann über technische Einstellungen, beispielsweise das Canonical-Tag,

Duplicate Content identifizieren

Um doppelte Inhalte zu identifizieren, können folgende Strategien angewendet werden:

  • Google Webmaster Tools: HTML-Verbesserungen
  • Google Suche mit „“
  • Verwendung von www.copyscape.com
  • Crawling der eigenen Website

Google Webmaster Tools

In den Google Webmaster Tools (hier unser E-Book) kann die Funktion „HTML-Verbesserungen“ bei der Identifizierung von Duplicate Content helfen. Doch Achtung: Nur weil verschiedene URLs denselben Seitentitel und/oder dieselbe Meta-Description verwenden, heißt das nicht, dass auch der Inhalt der Seiten gleich ist.

Google-Suche

Mittels des „“ Suchoperators kann nach exakten Textfragmenten gesucht werden. Gegebenenfalls sollte der site:domain.de-Befehl verwendet werden, um nur auf der eigenen Seite nach den zwischen den Anführungszeichen stehenden Worten zu suchen.

Copyscape

Mittels des Tools Copyscape (www.copyscape.com) kann im Netz nach Dokumenten gesucht werden, die dem übergebenen Dokument gleichen.

Crawling der eigenen Website

Mit Crawlern kann die eigene Webseite untersucht werden. Gegebenenfalls lassen sich durch die Crawlingergebnisse Seiten identifizieren, die sich (intern) ähneln.

Duplicate Content über unterschiedliche, eigene Domains hinweg

Angenommen, man verwendet dieselben Inhalte für unterschiedliche Domains, die auf verschiedene Zielmärkte (z.B. Deutschland und Österreich) ausgerichtet sind, ist dank des HTML-Tags ‚rel=“alternate“ hreflang=““‚ eine Umgehung von möglichen Duplicate Content Problemen gewährleistet. Mehr zu diesem Tag ist im Google-Blog zu finden.

Warum ist Duplicate Content problematisch?

Das Problem von doppelten Inhalten ist, dass diese unnötigerweise Ballast bei Suchmaschinen erzeugen. Da Google nur dann Inhalte finden kann, wenn diese verlinkt wurden, wird das Problem offensichtlich: Unterschiedliche URLs, die denselben Inhalt enthalten, werden verlinkt und müssen von Suchmaschinen gecrawlt werden. Dadurch wird die Verlinkung des „originalen“ Dokuments verschlechtert und Suchmaschinen müssen feststellen, welche Seite das Orignaldokument ist.

Zudem stellen duplizierte Inhalte keinen Mehrwert dar und kosten Suchmaschinen unnötigerweise Ressourcen.