Duplicate Content (DC) bei Google & Co

Wer nicht will, dass Google und Co. seine Website aufgrund von Duplicate Content (kurz auch als DC zu finden) abstrafen oder gar aus dem Index entfernen, der sollte beim Aufbau einer Website folgende Punkte beachten:

  • Die Website sollte entweder mit oder ohne „www.“ zu erreichen sein.
  • Sie sollten den gleichen Text nicht zweimal verwenden oder gar Text von anderen Websites kopieren.
  • Sie sollten Ihre Website möglichst so aufbauen, dass Crawler von Suchmaschinen den selben Text nicht mehrmals auslesen können; etwa über die Hauptseite, Kategorien und nochmal über die Archive (vgl. WordPress).

301-Redirect (Permanente Weiterleitung)

301-Redirect ist das Stichwort, um DC bei der „www.“ Subdomain zu verhindern. Das lässt sich am effektivsten per htaccess Datei umsetzen. Die .htaccess (mit Punkt und ohne Endung) Datei wird in das Root-Verzeichnis, das übergeordnetste Verzeichnis, auf das die Domain leitet, eingefügt. Die Umsetzung via htaccess ist zudem sehr suchmaschinenfreundlich, da sie serverseitig stattfindet.

Will man die Domain omaximus.de dann permanent auf die Subdomain „www.“ omaximus.de weiterleiten, müsste der Inahlt der htaccess Datei wie folgt aussehen:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.omaximus\.de$ [NC]
RewriteRule ^(.*)$ http://www.omaximus.de/$1 [R=301,L]

Möchte man es genau anders herum haben (ohne „www.“-Subdomain), geht das so:

RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.omaximus.de$ [NC]
RewriteRule ^(.*) http://omaximus.de/$1 [L,R=301]

Mit Scriptsprachen wie PHP lässt sich eine solche Weiterleitung übrigens auch einrichten:


<?php
header("HTTP/1.1 301 Moved Permanently");
header("Location:http://omaximus.de");
exit;
?>

 

Klientseitige Weiterleitungen

Klientseitige Weiterleitungen werden mittels HTML oder JavaScript ausgeführt und sind dementsprechend ungünstig für Crawler von Suchmaschinen – JavaScript wird nicht ausgeführt und HTML-Redirects werden abgewertet.
Die Umsetzung eines HTML-Redirects im Head-Bereich der Seite sollte dennoch kurz angesprochen werden:

<meta http-equiv=refresh content="1; URL=http://omaximus.de">

Die 1 gibt die Anzahl der Sekunden, die bis zur Weiterleitung vergehen sollen – in diesem Fall 1 Sekunde -, an.