Blog

Řešení duplicit u webů a eshopů: redirect 301, rel="canonical" tag

Autor: Ján Forgáč, publikováno: 24.01.2011 18:35
Článek je zařazen v kategorii: SEO a Inbound Marketing

Duplicitní obsah na webu je nevýhodný z hlediska vyhledávačů

kromě toho, že nám na internetu konkuruje mnoho jiných stránek optimalizovaných na daná slova, vytváříme si často konkurenci vlastním webem sami
případné zpětné odkazy by normálně byly nasměrované na jednu URL adresu, ale kvůli duplicitě se tyto linky rozdělí na různé podstránky (url adresy) a jejich síla se tudíž zmenšuje - link juice se roztéká do různých navzájem si konkurujících podstránek našeho webu
rozumné členění stránek na webu, pestrý výběr a cílení sousloví pomáhá získat dlouhý ocas klíčových slov (long tail), více v článcích: Analýza klíčových slov a Struktura webu z hlediska SEO
proto je velmi důležité, aby každá podstránka byla optimalizovaná na jinou frázi

Jak zajistit, aby nevznikaly duplicitní stránky na vašem webu?

1) Základní předpoklady pro odstranění přirozených duplicit i "omylů" autora

použít vhodný CMS systém, který vytvoří pro každou obsahovou stránku jedinečnou URL adresu a nevytváří duplicity
pečlivě rozmýšlet při cílení slov na jednotlivé podstránky webu, být "kreativní" tak, aby se zbytečně neobjevovala ta samá fráze na více podstránkách - viz SEO a struktura webu
interní linky musí zakaždým směrovat na jedinou verzi url adresy dané stránky, jinak vytváří autor duplicity sám

2) Metody odstraňování přirozených duplicit

2.1) Nasazení a nastavení redakčního systému tak, aby nevytvářel přirozené duplicity

Nevytvářet žádné duplicity je ideální řešení, ale ne vždy možné a proto uvádím i další alternativy řešení vzniklých duplicit.

2.2) Tag rel="canonical"

Implementovat rel="canonical" tag (co je rel="canonical" tag?) je řešení poměrně snadné, ale může být i zrádné při jeho chybné implementaci.

U všech stránek se stejným obsahem, ale na různých url adresách pomocí rel canonical označíme tu jedinou stránku, kterou mají vyhledávače zobrazovat ve výsledcích. "Link juice" všech těchto duplicitních stránek se spojí a posílí jen stránku označenou pomocí rel canonical za tu původní.

Zatím rel="canonical" dokáže zpracovat jen Google. Seznam ještě tento tag nepodporuje, ale plánuje spuštění a jeho používání

[editováno 1.6.2011]
Nově nasazený Seznam vyhledávací robot již podporuje kanonické URL. Dušan Janovský to odhadl velice přesně: "... až začne Seznam podporovat kanonický link (odhadem to na rok 2011) ...".

2.3) Permanentní přesměrování [permanent redirect] R 301

Všechny duplicitní stránky přesměrujeme na jejich originály, takže opět dojde ke "slití" link juice a posílení té správné stránky. Ideální pro ošetření duplicity celého webu, pokud funguje jak s www, tak i bez www na začátku adresy. Na linux serverech se toto dá pomocí .htacces a mod_rewrite, nebo přímo v php kódu.

2.4) Můžeme taky robotům zakázat indexování, ale povolit následování linků

Na duplicitní stránce to můžeme udělat pomocí metatagu: <meta name="robots" content="noindex,follow" />. Toto řešení je vhodné například u stránkovaných seznamů. Viz příklady níže v článku.

2.5) Nastavit ignorované parametry v Google webmasters tools

Google webmasters tools umožňují vybrat parametry, které mají být google ignorovány. Například řazení seznamů a podobně. Toto samozřejmě pak nemá žádný účinek na Seznam a jeho index. Proto toto řešení nebudu v příkladech uvádět.

3) Praktické řešení nejběžnějších problémů - jak může často duplicitní obsah vznikat

3.1) Stránky běží na subdoméně www, ale i bez www, přímo na doméně 2.řádu

-► Vznik duplicity celého webu

www.mujweb.cz
mujweb.cz

-► ŘEŠENÍ: přesměrovat permanentním redirectem R 301 jen na jednu verzi, buď s www, nebo bez www

3.2) Index.php

-► Dochází k duplicitě hlavní stránky a případně dalších podstránek

www.mujweb.cz
www.mujweb.cz/index.php, případně index.html, index.htm, default.asp ...

-► ŘEŠENÍ: přesměrovat permanentním redirectem R 301 na verzi bez index.php

3.3) Stejný produkt ve více kategoriích eshopu

-► Stejný obsah na více URL adresách

www.mujshop.cz/produkt-1-v-kategorii-1
www.mujshop.cz/produkt-1-v-kategorii-21
www.mujshop.cz/produkt-1-v-kategorii-5

-► ŘEŠENÍ: na všechny stejné produkty dát rel canonical s jedinou cílovou URL

3.4) Stránkování - pagination

-► Absolutní duplicita:

www.web.cz/seznam-1
www.web.cz/seznam-1?pagi=0

-► Duplicita z hlediska nadpisu, title a velice podobné URL adresy:

www.web.cz/seznam-1
www.web.cz/seznam-1?pagi=0
www.web.cz/seznam-1?pagi=1 (jiné produkty, ale stejné cílení)
www.web.cz/seznam-1?pagi=2 (jiné produkty)

-► ŘEŠENÍ: povolit indexování a sledování odkazu na první stránce stránkování a na dalšich odstránkovaných stránkách zakázat indexování, ale povolit na nich následování odkazů

www.web.cz/seznam-1

www.web.cz/seznam-1?pagi=0

www.web.cz/seznam-1?pagi=1 (jiné produkty, ale stejné cílení)

www.web.cz/seznam-1?pagi=2 (jiné produkty)

Další možnosti řešení problému duplicit vzniklých stránkováním se dočtete v tomto anglickém článku.

3.5) Další duplicity

-► řazení a filtry v seznamu výrobků

-► Tisková verze stránky na jiné URL

-► SESSID
-► Případné další duplicity

-► ŘEŠENÍ: podle uvážení zvolit jednu z navrhovaných variant

změna CMS a toho, jak web funguje
permanentní přesměrování R 301
správná implementace rel canonical
zakázání indexování, ale povolení následování odkazu

4) Pozor na fatální chyby implementace

4.1) Fatální chyba implementace rel canonical

Když celý web, nebo jeho součást bude označena jedinou kanonickou URL adresou, Google tudíž zahodí všechny ostatní podstránky a bude sledovat pouze tu jedinou. Váš web se kvůli tomu zmenší a přijdete tak o indexování stránek, které měly být zaindexované. Při nesprávné implementaci mohou nastat skutečně hororové scénáře. Doporučujeme raději několikanásobnou kontrolu dané implementace, neboť návštěvník webu si na rozdíl od robota ničeho nevšimne a snadno tento "detail" přehlédne.

4.2) Fatální chyba v zakázání indexování

Pokud zakážete indexovat větší část webu, opět Google i Seznam přestanou indexovat mnoho důležitých podstránek webu. Po opravě této chyby může trvat vyhledávačům velmi dlouho navrácení původních pozic. Může to být pro vás velmi bolestnou zkušeností. Snad ne nenávratnou, ale v tom nejhorším scénáři se může stát i to, že na původní návštěvnost z vyhledávačů se web již nedostane.

Duplicitní mandatorní texty

Co když kupříkladu u produktů na e-shopu dopíšeme skladování, používání a upozornění, tak nám vzniknou na webu duplicity velmi rychle. Tyto texty jsou u všech čajů stejné, nebo velmi podobné.

Důležité je, aby název produktu (v title, nadpise, url, ...) byl unikátní a rovněž popis produktu byl pokud možno co nejoriginálnější.

Je přirozené, že duplicity nějaké budou, ale duplicitní text by neměl být většina obsahu dané, v tomto případě produktové, pod-stránky.

Pokud se vám podaří výše spomínané zabezpečit, tak drobné duplicity jako je skladování, používání a podobně nebudou vadit.

Další zajímavé odkazy na dané téma na jiných webech

-► České texty

-► Anglické texty