Ein Problem, das wir auf fast jeder Website sehen, ist der doppelte Inhalt. Größere Websites mit Hunderten von Seiten sind dazu besonders anfällig. Aber was genau ist ein doppelter Inhalt? Warum führen doppelte Inhalte zu Problemen und wie können wir diese vermeiden? Wir werden das alles und mehr in diesem Artikel behandeln.
Duplikate Inhalte sind genau das, was du denkst: zwei oder mehr identische Inhalte, der einzige Unterschied ist die URL.
Google sieht jede URL als separate Seite. Aus diesem Grund würden die folgenden URLs als völlig andere Seiten betrachtet:
Das Problem hierbei ist, dass wir grundsätzlich dieselbe Seite mit demselben Inhalt betrachten. Der einzige Unterschied besteht darin, dass sich der Inhalt der letzten URL in einer anderen Reihenfolge befindet. Google sieht dies als doppelten Inhalt.
Doppelter Inhalt verwirrt Suchmaschinen. Warum? Weil es ihnen schwer fällt, zu entscheiden, welche Seite für eine Suchanfrage am relevantesten ist.
Suchmaschinen zeigen niemals zwei identische Inhalte in den SERPs an. Dies geschieht, um höchste Suchqualität zu gewährleisten. Den gleichen Inhalt zweimal zu sehen, ist für den Benutzer nicht sehr interessant.
Ein weiteres Problem ist das Ranking Macht von doppelten Seiten. Anstatt nur eine einzige Seite mit hoher Autorität zu haben, haben Sie mehrere Seiten mit verdünnter, suboptimaler Leistung. Dies kann Sie viel organischen Verkehr kosten.
Doppelte Inhalte können absichtlich oder zufällig erstellt werden. Trotzdem ist das Ergebnis dasselbe.
Ein Beispiel für beabsichtigten doppelten Inhalt ist die Druckversion einer Seite. Es handelt sich praktisch um dieselbe Seite mit demselben Inhalt. Wenn diese Druckversion indiziert wird, gibt es ein Problem mit doppeltem Inhalt.
Es gibt jedoch viele Situationen, in denen unbeabsichtigt doppelter Inhalt erstellt wird. Dafür kann es mehrere Ursachen geben:
Eine Sitzungs-ID ist eine Variable, eine Folge von zufällig generierten Zahlen und / oder Buchstaben, und wird verwendet, um Besucher zu verfolgen. Sie werden häufig für Einkaufswagen verwendet, zum Beispiel:
http://website.com/?sessionid=5649612
Das Problem mit Sitzungs-IDs ist offensichtlich: Sie können Hunderte, vielleicht sogar Tausende von Duplikaten erstellen. Durch das Speichern von Sitzungs-IDs in Cookies kann dieses Problem gelöst werden. Wenn Sie sich jedoch auf diese Option verlassen, vergessen Sie nicht das EU-Cookie-Gesetz.
Wenn Menschen über Sortieroptionen nachdenken, denken sie normalerweise über Webshop-Produktkataloge nach, in denen Benutzer nach Preis, Datum usw. sortieren können. Sortierfunktionen sind jedoch häufig auch auf anderen Websites zu finden. Die folgende URL verwendet eine typische Blog-Sortierfunktion:
http://website.com/category?sort=asc
Die URL mit der Sortieroption und das Original haben grundsätzlich dieselbe Seite. Es ist derselbe Inhalt, nur auf andere Weise sortiert.
Affiliate-Codes tauchen überall im Web auf. Sie dienen dazu, den Referrer zu identifizieren, der wiederum dafür belohnt wird, dass er einen neuen Besucher gebracht hat. Ein Partnercode kann beispielsweise folgendermaßen aussehen:
http://website.com/product?ref=name
Dieser Code kann wiederum ein Duplikat der Originalseite erstellen.
Sogar etwas so Einfaches wie ein Domain-Name kann manchmal problematisch sein. Schauen Sie sich die folgenden URLs an:
http://website.com
http://www.website.com
Suchmaschinen haben einen langen Weg zurückgelegt, aber gelegentlich bekommen sie immer noch einen Fehler. Beide URLs verweisen wahrscheinlich auf die Startseite. Da beide URLs jedoch unterschiedlich aussehen, werden sie manchmal als unterschiedliche Seiten betrachtet.
Wir haben darüber gesprochen, wie doppelter Inhalt erstellt wird. Wie können Sie jedoch Probleme mit dem doppelten Inhalt auf Ihrer Website feststellen??
Am einfachsten geht dies über Google Webmaster Tools. Melden Sie sich bei Ihrem Konto an und gehen Sie zu Optimierung> HTML-Verbesserungen. Hier finden Sie eine Liste doppelter Titel (wahrscheinlich doppelter Inhalt)..
Alternativ können Sie das eingeben site: -search Befehl In der URL-Leiste finden Sie Seiten einer bestimmten Domain (z. B. Website: webdesign.tutsplus.com). Diese Methode ist sehr nützlich, wenn Sie den Verdacht haben, dass eine bestimmte Seite mehrere Duplikate hat. Verwenden Sie den Site-Befehl und fügen Sie ein paar Sätze von der verdächtigen Seite ein. Wenn Sie von Google eine Nachricht erhalten, in der es heißt: "Um Ihnen die relevantesten Ergebnisse anzuzeigen, haben wir einige Einträge ausgelassen ...", haben Sie wahrscheinlich doppelten Inhalt.
Schließlich könnte man auch verwenden Site-Crawler. Mit Software wie Xenu und Screaming Frog können notwendige Informationen gesammelt werden. Analysieren Sie die Seitentitel im Durchforstungsbericht und suchen Sie nach Duplikaten.
Wie das Sprichwort sagt: "Jede Krankheit hat eine Heilung". Glücklicherweise gibt es mehrere Möglichkeiten, Probleme mit doppeltem Inhalt zu beheben:
Eine einfache Möglichkeit, die Indizierung von doppeltem Inhalt zu verhindern, ist eine 301-Weiterleitung. Auf diese Weise werden Benutzer und Suchmaschinen vom Duplikat zum Original umgeleitet. Daher wird der gesamte Link-Saft an die Originalseite gesendet.
Eine 301-Umleitung wird auf Apache-Servern implementiert, indem Regeln zur .htaccess-Datei Ihres Servers hinzugefügt werden. Beachten Sie, dass diese Methode die Kopie "löscht". Wenn Sie die doppelten Seiten nicht entfernen möchten, sollten Sie die folgende Methode verwenden.
Es gibt eine andere Möglichkeit, Suchmaschinen über doppelten Inhalt zu informieren. das rel = "kanonisch"
Etikett. Dieser Code sollte in der implementiert werden einer Webseite.
Nehmen wir an, wir haben Seite B, die ein Duplikat von Seite A ist. Wenn wir Suchmaschinen darüber informieren möchten, würden wir den folgenden Code in das Markup von Seite B einfügen:
Dieser Code gibt an, dass die aktuelle Seite tatsächlich eine Kopie der oben genannten URL ist. Nach der Implementierung werden die meisten Link-Juices auf die ursprüngliche Seite übertragen, wodurch die Rangfolge dieser Seite verbessert wird. Im Gegensatz zur 301-Weiterleitung sind die doppelten Seiten weiterhin zugänglich.
Wir haben das Meta-Tag der Roboter bereits in einem früheren Tutorial ausführlich besprochen. Durch Hinzufügen eines Meta-Robots-Tags mit dem Parameter "noindex" können Sie verhindern, dass die doppelte Seite indiziert wird.
Dies ist eine fortgeschrittenere Lösung. Es ist schwieriger zu implementieren, wenn Sie über ein begrenztes Verständnis von Code verfügen, es kann jedoch bei mehreren Gelegenheiten nützlich sein.
Wie bereits erwähnt, die Domänenname kann oft zu doppelten inhaltproblemen führen (www vs. nicht-www-version). Sie können dieses Problem lösen, indem Sie Ihrer htaccess-Datei eine URL-Umschreibregel hinzufügen (etwas anderes, das wir zuvor in Webdesigntuts + behandelt haben). Wählen Sie Ihre bevorzugte Domain (www oder nicht-www) und schreiben Sie die URLs automatisch in die angegebene Domain.
Ein anderes Problem, über das wir gesprochen haben, ist die Verwendung Sitzungs-IDs. Dieselbe URL mit einer anderen Sitzungs-ID kann als doppelter Inhalt angesehen werden. Wiederum kann die htaccess-Datei verwendet werden, um diese Parameter zu deaktivieren. Lesen Sie Deaktivieren Sie Sitzungs-IDs, die von Constantin Bejenaru über eine URL übergeben werden, um zu erfahren, wie Sie dies tun können.
Im vorherigen Abschnitt haben wir über das automatische Umschreiben von URLs für Domänennamen gesprochen. Eine einfachere Methode ist dies über die Google Webmaster-Tools. Melden Sie sich einfach bei Ihrem Konto an, gehen Sie zu Konfiguration, klicken Sie auf Einstellungen und legen Sie ein fest bevorzugte Domäne.
Wenn du verwendest dynamische URL-Parameter, Sie können Google mitteilen, wie sie damit umgehen sollen. Auf diese Weise können Sie feststellen, welche Parameter ignoriert werden sollen. Dadurch können häufig Probleme mit doppeltem Inhalt gelöst werden. Besuchen Sie die Google Webmaster-Tools und gehen Sie zu Konfiguration> URL-Parameter. Weitere Informationen erhalten Sie beim Google-Support. Sie sollten diese Funktion jedoch nur verwenden, wenn Sie wissen, wie Parameter funktionieren. Andernfalls können Sie Seiten versehentlich blockieren.
Dieses Problem bezieht sich auf doppelten Inhalt, es gibt jedoch einige Unterschiede.
Nehmen wir an, ein Unternehmen, das Produkte in Nordamerika verkauft, hat zwei Websites: company.us und company.ca. Der erste richtet sich an die Vereinigten Staaten, der letzte an Kanada. Auf beiden Websites finden wir ähnliche Inhalte, da die Webmaster nicht mehrere Textseiten neu schreiben wollten.
Es ist möglich, dass die US-Version die kanadische Version übertrifft (sogar auf Google.ca), da sie über mehr Autorität verfügt. Wie können wir dieses Targeting-Problem beheben??
Es gibt eine einfache Lösung: die rel = "alternate" hreflang = "x"
Anmerkung.
Wenn wir unser vorheriges Beispiel verwenden, müssen wir den folgenden Code in das einfügen Abschnitt der .us-Domain:
Auf der .ca-Domain müssen wir diesen Code eingeben:
Im Wesentlichen sagen Sie Google, dass es eine alternative Version (oder ein Duplikat) in einer anderen Sprache gibt. Das hreflang-Attribut verwendet ISO 639-1, um die Sprache zu identifizieren. Optional können Sie die Region im ISO 3166-1-Format hinzufügen.
Vorbeugen ist besser als heilen… Konsequente interne Verlinkung kann die Erstellung doppelten Inhalts verhindern. Wenn Sie http://www.website.com als bevorzugte Domäne verwenden, verweisen Sie Ihre internen Links nicht auf die Nicht-WWW-Version. Der gleiche Tipp gilt für eingehende Links. Wenn Sie von einer anderen Domäne aus auf Ihre eigene Site verweisen, verwenden Sie eine konsistente Linkstruktur.
Erstellen Sie nicht absichtlich doppelten Inhalt, indem Sie große Textblöcke von anderen Websites kopieren. Google wird es wahrscheinlich herausfinden und die Konsequenzen sind möglicherweise nicht so angenehm:
In den seltenen Fällen, in denen Google den Eindruck erweckt, dass doppelte Inhalte angezeigt werden, mit der Absicht, unser Ranking zu manipulieren und unsere Nutzer zu täuschen, kann das Ranking der Website leiden oder die Website wird vollständig aus dem Google-Index entfernt.
Doppelte Inhalte werden auf fast jeder Website angezeigt. Es kann verschiedene Ursachen haben, ob zufällig oder anders.
Sofern Sie nicht den Zugriff von der Seite über eine 301-Weiterleitung verhindern möchten, verwenden Sie am besten die rel = kanonische Anmerkung. Alternativ können Sie das Meta-Robots-Tag oder das automatische Umschreiben von URLs verwenden. Die Google Webmaster-Tools bieten auch einige Möglichkeiten, doppelten Inhalt zu verhindern.
Schließlich ist es am besten, bei der Verknüpfung konsistent zu sein. Interne Links und eingehende Links sollten gleich aussehen.