Gerade wer viele Seiten auf einer Website hat, gerät schnell in Gefahr, Inhalte doppelt zu veröffentlichen. Suchmaschinen wie Google mögen das gar nicht. In der Suchmaschinenoptimierung (SEO) spricht man von Duplicate Content. Hier erfahrt ihr, was ihr dabei beachten müsst und wie ihr doppelte Inhalte umgehen könnt.

Direkt zum Absatz springen: Probleme, Indizien, Vermeidung

Empfehlenswerte SEO Tools

Weitere empfehlenswerte SEO-Tools kannst du auf OMR Reviews finden und vergleichen. Insgesamt haben wir dort über 150 SEO-Tools (Stand: Dezember 2023) gelistet, die dir dabei helfen können, deinen organischen Traffic langfristig zu steigern. Also schau vorbei und vergleiche die Softwares mithilfe der verifizierten Nutzerbewertungen:

Wann ist eine Seite ein Duplicate Content?

Duplicate Content meint Inhalte, die auf Webseiten doppelt vorkommen. Neben Texten betrifft das auch Bilder, Codes oder andere Elemente. In der Regel müssen die Inhalte tatsächlich identisch sein. Google ist aber mittlerweile intelligent und erkennt auch ähnlichen Content.

Dabei lässt sich zwischen internem und externem Duplicate Content unterscheiden:

  • Interner Duplicate Content findet auf der eigenen Seite statt. Ein typischer Fall sind automatisch generierte Tag-Seiten. Auch Inhalte für mehrere Länder können sich doppeln. Um das zu verhindern, muss man insbesondere eine saubere Strategie und Onpage Optimierung haben.
  • Externer Duplicate Content kann entstehen, wenn Beiträge über mehrere Domains hinweg veröffentlicht werden. Auch wenn ihr eine Webseite beispielsweise über mehrere Hostnamen erreichbar macht, kann das zu einem Problem führen. Das Gleiche gilt, wenn eine Webseite sowohl mit www. als auch ohne www. oder unter http und https erreichbar ist. Zum Beispiel via https://beispiel.com oder http://beispiel.com.

Externer Duplicate Content kann entstehen, wenn die Seite über verschiedene Domains aufrufbar ist. Externer Duplicate Content kann entstehen, wenn die Seite über verschiedene Domains oder URL-Anfänge aufrufbar ist.

Warum ist Duplicate Content so ein Problem?

Dass Duplicate Content überhaupt ein Problem ist, liegt an Google. Im August 2013 nahm sich die Suchmaschine mithilfe seines Hummingbird-Updates die Falschschreibweisen und Synonyme von Keywords vor. Seitdem erkennt Google semantische Zusammenhänge viel besser. Für jedes Thema braucht Google jetzt nur noch eine Seite. Zum einen hat der Algorithmus sonst ein Problem damit, herauszufinden, welche Seite am passendsten für eine Suchanfrage ist. Zum anderen will sich Google Ressourcen sparen. Eine Seite zu crawlen ist aufwendig – und da ist es überflüssig, Seiten zu gleichen Themen in den Index zu nehmen.

Wenn man heute noch verschiedene Seiten zu einem Thema hat, ist das Duplicate Content. Diese Inhalte stuft Google in der Regel zurück. Ihr werdet also abgestraft dafür, dass ihr mehrere Seiten zu einem Thema habt. Kommt das häufiger vor, leidet die komplette Website. Das gilt es, zu vermeiden. Und vor allem ist es wichtig, unfreiwillig doppelte Inhalte zu entfernen.

Um die heutigen Qualitätsrichtlinien von Google zu berücksichtigen, müsst ihr auf Unique Content achten:

  • Recherchiert die Themen für Eure Texte gründlich – nur so könnt ihr alle Fragen der Nutzer beantworten und ihre Bedürfnisse vollständig decken.
  • Wählt für jede Seite eurer Websiet ein Fokus-Keyword aus und vermeidet so Keyword-Kannibalismus
  • Schreibt einzigartige SEO-Texte und klaut die Inhalte nicht von anderen Webseiten zusammen.
  • Macht Euch keine Gedanken über die Länge Eurer Texte: Schreibt einfach so viel, wie für das Thema sinnvoll ist.
  • Schreibt die Texte für die Nutzer. Verwendet also die Keywords so, wie sie im normalen Sprachgebrauch auch verwendet werden würden.
  • Baut die Seitenstruktur so auf, dass Doppelungen und Duplicate Content vermieden werden können.

Zum SEO-Leitfaden für Beginner

Duplicate Content erkennen

Trotz aller Vorsicht kann es passieren, dass Google Duplicate Content entdeckt. Das zeigt Euch die Suchmaschine sogar selbst an. Über die Google Search Console könnt ihr über den Punkt „Index“ und „Abdeckung“ die „Ausgeschlossenen Seiten“ einsehen. Das sind Seiten, die Google nicht indexiert hat. In der Liste unterhalb der Grafik können dazu die Gründe angezeigt werden. Steht dort „Duplikat“ habt ihr einen doppelten Inhalt entdeckt.

Auch Tools wie Ryte können doppelten Content erkennen. Über solche SEO-Content-Tools ist es sogar möglich, ähnliche Inhalte zu identifizieren.

Duplicate Content über die Search Console von Google erkennen Duplicate Content über die Search Console von Google erkennen.

Was könnt ihr dagegen tun?

Handelt es sich um externen Duplicate Content: erstmal wenig. Google schaut hier in der Regel, wer einen Inhalt als Erstes veröffentlicht hat. Das ist zum Beispiel bei Pressemitteilungen wichtig. Gebt ihr den Text an andere Seiten, solltet ihr ihn vorher schon auf Eurer Webseite haben.

Unbeabsichtigt erstellter interner Dublierte Content lässt sich leicht vermeiden. Dazu gibt es drei Lösungen, die in der Praxis Anwendung finden.

1. Weiterleitung einrichten

Leitet die Nutzer (und Google) per 301-Weiterleitung einfach auf die richtige Domain weiter. So könnt ihr mit einer Seite starke Rankings erzielen, weil alle Signale darauf einzahlen. Die Weiterleitung könnt ihr häufig im Backend Eures Hosters einrichten.

Über eine Weiterleitung kann doppelter Inhalt vermieden werden. Inhalte, die als Duplicate Content zählen, lassen sich über eine Weiterleitung aufs Original ausbremsen.

2. Canonical Tag

Mit dem Canonical Tag habt ihr die Möglichkeit, Suchmaschinen auf doppelte (duplicate) oder sehr ähnliche (near duplicate) Inhalte hinzuweisen. Ihr sagt der Suchmaschine also: „Ich bin mir bewusst, dass sich diese Inhalte doppeln, indexiere bitte nur das Original”.

Das „Original“ sollte hierbei immer die am besten optimierte URL sein. Der Tag wird anschließend im <head>-Bereich der „Duplikate“ nach folgendem Schema implementiert:

Dabei kann derselbe Canonical Tag auch auf mehreren Seiten eingebunden werden, wenn beispielsweise mehrere Duplicate Contents zu einem Original existieren.

3. Aus dem Index schmeißen

Die dritte Lösung ist, Seiten direkt aus dem Google-Index zu entfernen. Dazu lässt sich per Robots-Metatag die Seite auf „noindex,follow“ stellen. Die Folge: Die Seite fliegt von sich aus raus und so kann auch kein doppelter Inhalt mehr erkannt werden.

Wir hoffen, ihr konntet in diesem Beitrag etwas lernen. Wenn ihr mehr über die SEO-Optimierung wissen wollte, schaut Euch unsere Guides zum Thema an: den SEO Report für Beginner und SEO-Report für Profis. Wir würden uns freuen!