Po internetu koluje spousta informací o tom, jak vlastně Google hodnotí stránky a jaké faktory bere v úvahu. Mnohdy se jedná o neověřené informace, nebo přinejmenším dohady. Prakticky každý cituje někoho jiného a jen málokdo si dá tu práci, aby si důvod pro své přesvědčení nějak ověřil. Přitom pokud se majitelé stránek řídí radami, které se se skutečností neshodují, mohou stránky dokonce poškodit.
Nikdo vlastně přesně neví jak a podle čeho Google stránky řadí. Čemu jaký význam přikládá a jaký algoritmus pro výpočet pozic používá, to Google nikomu nikdy neprozradí. Přesto jsou známé některé skutečnosti. Nechci ale čerpat z nějakých náhodných blogů či fór, případně opakovat co jsem někde slyšel. Celkem spolehlivé zdroje informací o SEO faktorech jsou asi 3:
- Patenty Googlu
- Vyjádření společnosti Google, nebo jednotlivých členů jeho týmů
- Uplatnění metod jako zpětné inženýrství, A/B testování a dalších
Z těchto zdrojů lze získat poměrně jasnou představu o způsobu, jak Google řadí stránky a čemu přikládá jaký význam a důležitost. Sestavil jsem tedy přehled jednotlivých faktorů. V zásadě se dělí na 2 tábory
- on-page – ty se týkají přímo stránek. Texty, titulky, popisky, nadpisy apod.
- off-page – ty se týkají věcí, které se odehrávají jinde než na stránkách. Většinou jde o zpětné odkazy
Další hledisko dělení je na:
- pozitivní faktory – pomáhají stránkám k lepšímu umístění
- negativní faktory – ty vyhledávače trestají
Každý z jednotlivých faktorů ještě označím jako:
- mýtus – nepravdivá informace
- možný – nelze říci jak to skutečně je, nejsou jasné zdroje informací
- pravděpodobný – zřejmě je to tak, ale přímé potvrzení chybí, jen praxe to ukazuje
- jistý – potvrzeno konkrétním zdrojem a ověřeno praxí
Pozitivní on-page faktory
Klíčové slovo v URL
Klíčová slova a fráze, které se objevují v URL stránky, mimo doménového jména, mohou pomoci při stanovení relevance části obsahu pro konkrétní vyhledávací dotaz. Výkon ale klesá s větším počtem klíčových slov, tedy s délkou URL, a s opakováním klíčového slova.
Pořadí klíčových slov v URL
Zdá se, že pokud se slova v URL objevují blíže k začátku, mají vyšší váhu. Minimálně potvrdil v rozhovoru Matt Cutts, že „po asi pěti“ slovech se váha klíčového slova zmenšuje.
Klíčové slovo v tagu Title
Tag <title> definuje název dokumentu nebo stránky. Objevuje se v záložce prohlížeče a často se objeví i v SERPu (ve výsledcích hledání) a jako název úryvku pro sociální sdílení. Neměl by být delší než 60-70 znaků, v závislosti na šířce znaků. Stejně jako u URL, klíčová slova blíže začátku mají velmi pravděpodobně větší váhu.
Hustota klíčových slov na stránce
Procento případů, kdy se klíčové slovo objeví v textu. Kdysi se doporučovala hustota klíčového slova / fráze okolo 5,5% -6%. Okolo roku 2000, to bylo velmi účinné. Google ale od té doby přišel s jinými typy obsahové analýzy, takže tyto taktiky jsou v současnosti již stěží relevantní. Ale samozřejmě, že by se na jednu stranu klíčová slova na stránce měla vyskytovat v dostatečně přesvědčivém množství, na druhou stranu se to nesmí přehánět, protože to vyhledávače trestají.
TF-IDF – frekvence klíčových slov
Nejde o obyčejnou hustotu klíčových slov v textu. TF-IDF spíše hodnotí, zda použitá hustota je podobná, jako je běžně obvyklé. V zásadě se ví, kolikrát normálně gramotný člověk průměrně zmíní klíčový výraz jako třeba „faktory hodnocení stránek“ v článku, který se tomuto tématu věnuje.
Klíčová slova uvedená v nadpisech H1, H2 atd.
Klíčová slova v nadpisech mají silnou váhu při stanovení příslušného předmětu stránky. H1 tag nese větší váhu, H2 má méně, a tak dále. Nadpisy také zlepšují přístupnost pro čtečky obrazovky a jasné, popisné texty v nadpisech snižují podle různých studií míru opuštění.
Slova s výrazným formátováním
Klíčová slova zvýrazněná tučně, kurzívou, podtržením, nebo větším písmem mají větší váhu při stanovení příslušného předmětu stránky, ale menší váhu než slova v nadpisech. To potvrzuje i Matt Cutts, SEO, a patent, který říká: „matches in text that is of larger font or bolded or italicized may be weighted more than matches in normal text.“
Proximita klíčových slov
Pokud se klíčový výraz skládá z více slov, měří se proximita, neboli blízkost slov. Jeden odstavec o SEO analýze bude mít vyšší váhu, pokud v něm bude použit výraz „SEO analýza“ než když v jednom odstavci bude „SEO“ a v druhém „analýza“
Klíčové slovo jako text v Alt
Atribut Alt se používá pro textový popis netextových prvků na stránce. Nejčastěji obrázků. Umožňuje tak čtečkám pochopit význam a obsah obrázku. Zlepšuje se tak přístupnost webu.
Uvedení přesné fráze klíčových slov
I když Google může vrátit výsledky vyhledávání, které obsahují pouze část hledaného výrazu (nebo v některých případech vůbec žádné), patent uvádí, že vyšší skóre je přiděleno přesné shodě. Konkrétně uvádí, že „dokument odpovídající všem podmínkám vyhledávacího dotazu může získat vyšší skóre, než dokument odpovídající jednomu z těchto výrazů.“
Uvedení klíčových slov na začátku dokumentu
Je přirozené, že důležité informace řadíme shora a zleva. Klíčová slova, která se vyskytují v horní části stránky, mohou mít větší váhu než ta, která jsou na stránce níž. Zejména, pokud je nutné stránku scrollovat dolů, mohou slova dostat nižší hodnocení, nejsou-li viditelná bez scrollování.
Keyword Stemming
jde o automatické zkracování slov dle slovních kořenů, pro účely indexování dokumentů vyhledávači a následně při vyhodnocování hledaného dotazu uživatele. Tedy po zadání slova „plavání“, budou vyhledávači nalezeny i stránky obsahující slova jako je „plavat, plavčík, plavba…“. Je-li stemming užíván automaticky, může negativně ovlivnit výsledky vyhledávání, protože rozšiřuje množinu slov o nežádoucí dokumenty.
Anchor text u interních odkazů
Anchor text odkazu řekne uživateli kam tento odkaz vede. Je to důležitá součást navigace v rámci vlastní webové stránky, a pokud nejsou zneužívány, pomáhají vytvářet relevantní strukturu obsahu místo vágní alternativy, jako například „klikněte sem“.
Shoda klíčových slov s názvem domény
Stránky mohou získat vyšší hodnocení, pokud se vyhledávací dotaz přesně shoduje s textem v názvu domény, a Google navíc dotaz vyhodnotí jako „obchodní dotaz“. To bylo navrženo kvůli brandovému vyhledávání.
Klíčové slovo v názvu domény
Hodnocení stránek se zvýší, když klíčové slovo nebo slovní existuje v rámci doménového jména. Je pravděpodobně přidělena menší váha, než když název domény přesně odpovídá dotazu, ale mnohem významnější než když se výraz objeví později v další části URL.
Distribuce PageRanku
PageRank je algoritmus pro ohodnocení důležitosti webových stránek, navržený Larry Pagem a Sergeyem Brinem, tvořící základ vyhledávače Google. Algoritmus využívá strukturu hypertextových odkazů jako vzájemné “doporučování” stránek, ne nepodobné hodnocení vědeckých prací podle počtu citací. Obecně čím více vede na stránky odkazů z lépe hodnocených webů a čím méně odkazují stránky na jiné weby, tím vyšší PageRank mohou obdržet
Stáří domény
Starší domény požívají o trochu více důvěry, ale Matt Cutts zdůrazňuje, že ačkoli tento princip existuje, jde celkem o minoritní faktor. Mladým doménám může pomoci, pokud se prokáže, že nejsou zapojeny do nějakých krátkodobých projektů, či přímo Black Hat projektů.
Nová doména
Nové domény mohou získat dočasnou podporu v žebříčku. V patentu se diskutuje způsob stanovení čerstvého obsahu, a je uvedeno: „datum, kdy je doména registrována, může být použit jako údaj o datu vzniku tohoto dokumentu.“ To znamená, že dopad je podle Matta Cuttse, relativně malý.
Spojovník (pomlčka) jako oddělovač slov v URL
Ideální způsob separace klíčových slova v URL je použití spojovníku (nesprávně vnímaného jako pomlčka). Podtržítka mohou také fungovat, ale nejsou tak spolehlivá, protože mohou být zaměňována s proměnnými programovacího jazyka. Spojování slov dohromady v URL, je také špatně. Pravděpodobně způsobí, že Google neobjeví slova, která měla být vnímána jako samostatná klíčová slova, čímž se připravíte o bonus v podobě uvedení klíčových slov v URL.
Registrace doménového jména na delší dobu
Google přímo uvádí v patentu, že registrace domény na delší dobu dovoluje předvídat legitimitu domény. Google odhadne, že se doména pravděpodobně nechce zapojit do webového spamu, že se nejedná o krátkodobý projekt.
veřejné Whois
Je docela možné, že přes snahy Google bagatelizovat jejich schopnost vytěžit informace o doméně informace z Whois služby, existuje patent, který pojednává o podmínkách registrace domén. Také Matt Cutts hovoří o soukromém neveřejném zápisu ve Whois jako o tom, co může přispět k nižšímu hodnocení stránek a svádí majitele k uvádění nepravdivých informací o své doméně.
Použití HTTPS (SSL)
SSL byl oficiálně vyhlášen jako nový pozitivní faktor žebříčku v roce 2014. Použití HTTPS zvyšuje bezpečnost stránek a tím i jejich váhu a hodnocení.
Použití strukturovaných dat
S příchodem schema.org, společného projektu společností Google, Yahoo!, Bing a Yandex lze určit logické entity dat a jejich význam. V současné době používání strukturovaných dat může zlepšit hodnocení.
Čerstvý obsah
Vyhledávače raději nabízí odkaz na článek, který má aktuálnější informace a je tedy „čerstvější“. To samozřejmě neplatí pro každý dotaz a každou čerstvou informaci, ale tento princip se uplatňuje celkem hodně třeba u zpravodajských a informativních webů.
Starý obsah
Jeden z patentů Google uvádí, že někdy mohou mít starší dokumenty pro uživatele větší význam, než ty nové. Pokračuje pak popisem scénáře, kdy před uveřejněním výsledků ještě vyhledávač přepočítá pozice s ohledem na větší stáří dokumentu.
Kvalita odchozích odkazů
I když odchozí odkazy ředí PageRank, neměly by stránky být úplně bez odchozích odkazů. Google odměňuje kvalitní odchozí odkazy na „dobré stránky“. Matt Cutts říká: „část našeho systému posiluje vazby na dobré stránky“.
Relevance odchozích odkazů
Vzhledem k tomu, že Google hodnotí u příchozích odkazů kvalitu, relevanci, kontext a autoritu, zdá se rozumné přistupovat k tvorbě odchozích odkazů stejně. Měly by být relevantní a autoritativní.
Pravopis a gramatika
Nelze jednoznačně říci, jak moc použití správného pravopisu ovlivňuje hodnocení. Například Bing mu přikládá celkem vysokou důležitost. Google se vyjádřil tak, že mají snahu nabízet kvalitní obsah. První aktualizace Pandy také naznačila, že na tom celkem dost záleží. Je to ale nepodloženo patentem, jen vyjádřeními členů týmů a praktickými testy.
Použití multimedií
Po aktualizaci Panda 2.5 se zdá, že použití videa na stránkách hraje větší roli než do té doby. Stránky mohou těžit z vyhledávání přímo videí či obrázků. Neexistuje však žádné potvrzení této domněnky kromě výsledků testování.
Meta keywords
Někdo tvrdí, že na užití meta tagu keywords nikdy nezáleželo. To je mýtus. Na druhou stranu představa, že Google hodnotí meta klíčová slova ještě v roce 2016 je také mýtus. Obě tyto skutečnosti byly potvrzeny stejným způsobem – testováním. Mějte však na paměti, že Google není jediný vyhledávač, a mohl v minulosti teoreticky indexovat bezpočet dalších dynamických stránek, které těží ze značky keywords.
Podpora mobilního zobrazování
Weby přátelské k mobilnímu prohlížení mají veřejně deklarovanou značnou výhodu. Prozatím pouze pro uživatele, kteří opravdu v danou chvíli vyhledávají na mobilním zařízení. To se stalo v poslední době velkým tématem, ačkoli se k tomu směřovalo již téměř 10 let.
Meta description
Dobrý popisek funguje jako reklamy ve vyhledávání. Význam meta tagu description tedy nemůžeme podhodnotit. Na druhou stranu, přestože klíčová slova, použitá v description, byla kdysi široce považována za přímý faktor řazení, Matt Cutts uvedl v roce 2009, že nyní to už není tak přímočaré.
Google Analytics
Mnozí se domnívají, že Google Analytics je, nebo se může stát faktorem pořadí ve vyhledávání v Google. Všechny důkazy v současné době, stejně jako velmi jednoznačné vyjádření od Matta Cuttse, naznačují, že jakékoli domnělé výhody, pocházející z použití Google Analytics, nyní nebo někdy v budoucnosti, jsou absolutní mýtus. GA je stále neuvěřitelně mocný nástroj pro analýzu, ale na řazení nemá nejmenší vliv.
Nástroje pro webmastery – Google Search Console
Stejně jako Google Analytics, nejsou zde žádné potvrzené výhody při použití Google Search Console (dříve známý jako Webmaster Tools). Search Console je jistě užitečný v odkrývání problémů souvisejících s umístěním ve výsledcích, zejména těch, které souvisejí s ručním udělením penalizace, ale sám umístění neovlivňuje.
XML sitemaps
Sitemapy jsou užitečné pro rychlejší a komplexnější oindexování webu. Ale představa, že mapa stránek zlepší pozici v žebříčku výsledků, je mýtus. To potvrzuje přímo Google a také různé studie.
Frázování a kontext
Stejně jako hustota klíčových slov je nyní prakticky non-faktor, základní znalost indexování nám říká, že pokud píšete o obsahu důkladně a komplikovaně, máte mnohem větší šanci na lepší místo v žebříčku ve srovnání s psaním obsahu, který je pouze plný klíčových slov v přené shodě. Jasná součást jednoho patentu Google to popisuje jako „identifikaci souvisejících frází a spojení souvisejících frází“.
Sídlo webových stránek blízko k uživateli
Pokud jsou stránky registrovány na Google Maps, je možné určit jejich umístění. Tím, že vaše stránky hostují alespoň volně blízko ke svým uživatelům, například v rámci jedné země, budete mít pravděpodobně lepší hodnocení.
Reputace autora
Autorství byl experiment, který na Google běžel od roku 2011 do roku 2014. Pomáhal bloggerům pomocí tagu rel = „author“ vytvořit reputaci jednotlivých autorů. Google přímo potvrdil zánik autorství. Uvést jej stále lze, jen na výsledcích vyhledávání se nepodílí
Používání rel = „canonical“
Rel = „canonical“ může zabránit duplicitnímu obsahu, devalvaci a penalizaci v případě více adres URL se stejným či velmi podobným obsahem. Podle Googlu se přímo nepodílí na umístění v žebříčku. Přes to všechno, je to velmi dobrý nápad jak zabránit penalizaci webu za duplicitu.
URL používá „www“ subdoménu
Někteří naznačují, že může být lepší, když adresy začínají na „www“. To vychází z myšlenky, že často uživatel zadá „www“ automaticky. Také některé stránky přesměrují provoz z tvaru bez „www“ na tvar s „www“. Důvodem k přesměrování ale není snaha o lepší umístění, nýbrž vyhnutí se duplicitě, kdy stránky fungují jak ve tvaru s „www“, tak bez něj. Mnoho webů to dělá opačně a přesměruje provoz na variantu bez „www“.
Vyhrazená IP adresa
IP adresy serveru mohou být užitečné pro geo cílení na určité demografie. Mohou být i v negativním žebříčku faktorů, když IP adresa patří mezi významné producenty webového spamu. Ale představa, že jen mít vyhrazenou IP adresu, poskytuje nějakou výhody, je mýtus.
Použití AdSense
V zásadě žádný nástroj od Google nikdy přímo neovlivní výsledky hledání. Google by tak šel proti svým zájmům, kdyby před kvalitními stránkami upřednostnil stránky méně kvalitní jen proto, že jsou zapojeny do jeho provizního systému.
Klíčová slova v komentářích, css, identifikátorech a názvech tříd
Pomocí experimentu lze snadno dokázat, že klíčová slova v komentářích nehrají v umístění žádnou roli. Stačí umístit v komentáři (css, identifikátoru) nějaké extrémně nekonkurenční nehledané slovo a umístit odkaz na takovou stránku, aby se dostala do indexu. Pokud se pak po zadání daného výrazu objeví stránka ve výsledcích, máme důkaz, že Google hodnotí toto slovo. V tomto případě ale zjistíte, že tomu tak není.
Nízký poměr HTML kódu vůči textovému obsahu
Jistota není, ale zdá se, že menší poměr množství kódu vůči obsahu přispívá k pozitivnímu hodnocení. Naznačují to nepřímé důkazy – 1) rychlost načítání je potvrzený pozitivní prvek (méně kódu = větší rychlost), 2) Google doporučuje nástroj PageSpeed Insights, který nutí webmastery ke snížení velikosti kódu pod 5 KB, 3) některé chyby v kódu mohou způsobit penalizaci (méně kódu, méně možných chyb)
Negativní on-page faktory
Vysoká hustota klíčových slov v dokumentu
Nadužívání klíčových slov může vést až k penalizacím. Kdysi mimořádné účinná taktika, čili zvyšování hustoty klíčových slov často až k extrémně vysoké úrovni je tedy nyní spíše ke škodě. Experimenty ukázaly, že sankce mohou být uděleny již při hustotě 6%, ačkoli TF-IDF (vysvětlené v pozitivních faktorech), hraje svou roli také.
Hustota klíčových slov v titulku
Kromě stránky a viditelného textu, se pro sankce za vysokou hustotu klíčových slov nabízí nadužívání v titulku stránky. Ideální tag title by neměl přesáhnout nějakých 60 až 70 znaků a přitom poskytovat dostatek informací o stránce, na které je uveden. Je ale kontraproduktivní uvádět v titulku jen 5x klíčový výraz. Uživatelům to nic nepřinese a tak i Google bude nespokojen.
Příliš dlouhý titulek
Jak již bylo řečeno, titulek má smysl, pokud se vypíše celý ve výsledcích vyhledávání. No a delší než 70 znaků se pravděpodobně nevejde. Je tedy jedno, že uděláte titulek dlouhý 300 znaků a vejde se vám do něj 3x klíčové slovo. Víc než 70 znaků stejně nikdo nevidí. Je pravděpodobné, že Google bude upřednostňovat ty stránky, jejichž titulek se zobrazí celý
Vysoká hustota klíčových slov v nadpisech
Nadpisy H1, H2 a v omezené míře i H3 – H5 určují váhu klíčových slov. Je jistě dobrý nápad klíčová slova v nadpisech uvádět. Důležitá je ale přirozenost. Pokud sklouznete k tzv. tapetování, čili bezduchému vypisování klíčových slov v přesné shodě, budete pravděpodobně penalizováni.
Nadužívání nadpisů
Použití nadpisů je dobrý nápad, pokud se to nepřehání. Dlouhý čas se razila myšlenka, že na jedné stránce by měl být jen jeden nadpis H1 a pak další nadpisy H2, H3 atd. a to hierarchicky řazené. Přitom ale specifikace HTML toto nikde neomezuje. S příchodem HTML5 a možností členit stránky do sekcí je úplně legální dát každé sekci vlastní H1 nadpis.
Je ovšem otázkou, jak se k tomu staví Google. Pokud je na stránce příliš nadpisů, je sankce velmi pravděpodobná. Stačí malý experiment – veškerý text na stránce dejte do nadpisů H1.
Více klíčových slov v URL
Zatímco jedno uvedení klíčového slova v URL je pozitivní faktor, vícenásobné uvedení pravděpodobně sníží hodnocení stránek. Stačí opět malý test – uveďte v URL klíčové slovo 5x za sebou a počkejte si na trest.
Příliš dlouhé URL
Matt Cuts říká, že po asi pěti slovech v URL se význam dalších slov snižuje. Bing, i když funguje trochu jinak, vychází ze stejného principu. Prodlužování URL jen kvůli tomu, aby se vešlo více klíčových slov, tedy nepovede k žádnému profitu a může to stránky poškodit.
Více klíčových slov v Alt, nebo příliš dlouhé Alt popisky
Jelikož Alt popisky nejsou při běžném zobrazení pro uživatele přímo viditelné, často se zneužívají k dlouhému výpisu klíčových slov. Uvádět smysluplný obsah v Alt popisku je dobré a vlastně je to i vyžadováno kvůli specifikaci HTML a pravidlům přístupnosti, ale jako vždy – všeho moc škodí.
Příliš dlouhé anchor texty odkazů
Příliš dlouhý anchor text nepřináší žádný užitek. A co je neužitečné, je škodlivé. Škodlivé věci nemá Google rád a trestá je. Je opravdu dobré, pokud je anchor text odkazu vyplněn smysluplně a obsahuje klíčové slovo, ale neměl by to být celý odstavec.
Vysoký poměr odkazů vůči ostatnímu textu
Není to sice potvrzeno přímo vyjádřením Google ani žádným patentem, ale dá se předpokládat, že pokud je na stránce vícero odkazů a málo ostatního textu, bude stránka hodnocena hůře, než ta, která má kvalitní originální text a několik relevantních odkazů.
Příliš mnoho „seznamového“ textu
Uvést klíčové slovo v textu tak, aby to vypadalo přirozeně, je celkem složitá věc. Mnoho tvůrců stránek tedy sklouzne k nějakému výčtu produktů či služeb. Pokud se to opakuje častěji, Google to nebude považovat za přirozené a dostaví se sankce.
Skrývání obsahu JavaScriptem
JavaScript je programovací jazyk a jako takový je uživatelům nečitelný. Nicméně celkem dobře umí manipulovat s obsahem stránky – skrývat různé texty a zase je zobrazovat, rozpohybovat nějakou animaci, nebo co je horší, nabídnout jiný obsah uživateli a jiný obsah vyhledávači. Používají li stránky javascript k předložení rozdílného obsahu, může to vést k sankcím.
Skrývání obsahu pomocí CSS stylů
Podobně jako u JavaScriptu, také CSS umí skrývat text před uživateli. Jde třeba o zpětné odkazy, které nechceme uživatelům ukazovat, odstavce plné klíčových slov apod. Na rozdíl od JavaScriptu, kde jde zatím jen o předpoklad, tak u CSS jde o dobře zdokumentovaný fakt, že tyto techniky vedou k penalizaci.
Barva popředí shodná s barvou pozadí
Jde vlastně o podobný trik, jako u skrytí nějakého prvku pomocí CSS. Jednoduše se nastaví bílá barva textu na bílém pozadí a uživatelé nic nevidí. Cílem je, aby v takovém textu byla vyšší hustota klíčových slov pro Google. Ovšem toto je jasné porušení pravidel a jistě bude následovat trest.
Obrázky velikosti 1×1 pixel jako odkazy
Opět další způsob jak zamaskovat odkazy, vedoucí z našeho webu jinam. Ale když už uvedete nějaký odkaz na svých stránkách, neměli byste se za něj stydět. Smyslem odkazu podle Google je, aby na něj uživatelé mohli kliknout. Ale pokud jej nenajdou, jak na něj kliknou? Něco podobného povede jistě k penalizaci.
Odkazy s prázdným anchor textem
Opět technika k zakrytí odkazů. Uvedete odkaz se vším všudy, ale vynecháte anchor text. Odkaz tedy existuje jen v kódu, ale uživateli se nezobrazí. pokud si majitel cílových stránek hlídá nějakým nástrojem, zda na vašich stránkách odkaz existuje, dostane kladnou odpověď, ačkoli se na takový odkaz vlastně nedá kliknout. Něco takového Google nebude tolerovat.
Porušení Copyrightu
Google dbá na dodržování legislativy celkem důsledně. Originální a přínosný text odmění, zkopírovaný text nebude hodnotit příznivě, ale stránky s textem, či jiný obsah, který porušuje copyrigt, zcela jistě postihnou sankce. Majitel takového obsahu dokonce může ručně nahlásit zneužití svých práv, ačkoli Google aktivně takové případy vyhledává a stránky většinou postihne nevratný ban a ve výsledcích vyhledávání se již nikdy neobjeví.
Doorway pages
Doorway page je stránka, jejíž obsah byl vytvořen tak, aby zaujal roboty vyhledávačů, měla by se proto umístit na dobrém místě ve výsledcích vyhledávání. Protože však doorway stránka potom nedokáže plnit svůj marketingový úkol (např. prodávat zboží), využívá se automatické přesměrování na jinou. Jde o zjevnou manipulaci s výsledky vyhledávání a vypadnutí webu z výsledku vyhledávání se dostaví celkem jistě.
Nadužívání tučného textu, kurzívy a jiného zdůraznění
Tučný text, nebo kurzíva mají pozitivní vliv – zdůrazňují důležité prvky stránky. Pokud je ale většina textu tučně či kurzívou, snažíme se přesvědčit vyhledávač, že veškerý text na stránce je nejdůležitější. Zavání to spamovacími technikami, takže to nakonec pravděpodobně stránky poškodí.
Nefunkční vnitřní odkazy
Odkazy sice patří do off-page faktorů, ale protože jde o vnitřní odkazy, jsou zařazeny sem. Vnitřní odkazy jsou významným prvkem, který pomáhá k indexaci webu, vedou klienta a vyhledávač po stránkách a usnadňují orientaci. Pokud ale vnitřní odkaz vede na neexistující stránku, jeto spolehlivý ukazatel nekvalitních stránek. Ujistěte se, že takové nefungující odkazy na webu nemáte, protože to jistě vede k penalizaci webu.
Texty v obrázcích, videích a jiných médiích
Někteří tvůrci stránek používají pro ozdobné texty a nápisy obrázek. Je jednodušší takový obrázek vystřihnout z grafického návrhu a umístit do stránky. Google ale urazil celkem dlouhou cestu při snaze naučit se rozpoznat texty uvnitř obrázku. Je velmi nepravděpodobné, že pokud uživatel hledá obrázek Sněhurky, bude spokojen s ozdobným textem „Sněhurka“. Google zcela jistě nechce takový „obrázek“ svým uživatelům nabízet a tak znevýhodní stránky, na kterých je takový textový obrázek uveden.
Použití rámců
Kdysi se rámce používaly hojně. Myšlenka to byla dobrá – pokud je v horní části stránky obrázkové logo a v patičce adresa provozovny, není nutné je při změně stránky měnit. Uvedly se proto v rámcích (které se neměnily) a pouze samotný obsah (ve vlastním rámci) se změnil. Šetřil se datový přenos. Bohužel vyhledávačům se nedaří správně takové stránky procházet a rámce nemají rády. Jistě upřednostní jiné stránky bez rámců.
Nedostatečný, nepřínosný obsah
Se zavedením algoritmu Panda čelí stránky se vzájemně podobným obsahem velkému problému. Pokud jsou stovky webů, které obsahují 5 stránek – homepage, o nás, historie, služby a kontakty – jakou stránku má Google umístit do výsledků vyhledávání? Pokud nejsou texty originální, dostatečně bohaté, zajímavé a pro uživatele přínosné, propadnou se ve vyhledávání zcela jistě.
Příliš mnoho reklamy, nebo pop-up oken
Stránky, které chtějí vydělávat na reklamě, podobně jako stránky s vyskakujícími okny, bude Google penalizovat. Vytvářejí totiž nepříjemný uživatelský dojem. Google k posouzení používá snímky obrazovky a vylepšený algoritmus známý jako Top Heavy Update.
Duplicitní obsah
Toto je jistě největší bolest Internetu. Na mnoha webech se vyskytuje naprosto stejná informace. A nejde jen o nějaké jednoduché sdělení – opisují se celé články a dokonce kopírují celé weby. Za duplicitu se ale považuje i to, že máte stejný, či velmi podobný obsah na několika adresách vlastního webu. Chybou třeba je, že jsou stránky dostupné s „www“ na začátku i bez něj. Z hlediska Google jsou to 2 různá URL, na kterých je identický obsah a tedy jasná duplicita. Tu Google trestá opravdu nemilosrdně a rychle.
Nevhodné odchozí odkazy
Jen těžko můžete ovlivnit, kdo se rozhodne odkazovat na váš web. ale nad odchozími odkazy máte plnou moc. Odkazovat tedy na nějaké linkfarmy, nelegální obsah, pirátská videa apod., není dobrý nápad. Vyjadřujete tím podporu takových stránek, které Google tvrdě penalizuje. Čekejte, že s vámi naloží jako se stejně provinilými stránkami.
Pomalé stránky
Co se nenačte do dvou sekund, to považuje Google za pomalé. Uživatelé neradi čekají. Nejlépe je, pokud stránky reagují ihned, aby uživatel nepostřehl zpomalení. Google veřejně deklaruje, že upřednostní rychlejší stránky oproti pomalejším. Tvůrce nutí svými nástroji zkrátit odezvu stránek na minimum.
Noindex pro roboty nebo Disallow
Pokud stránka obsahuje meta tag „robots“ v hodnotou „noindex“, nebo se v souboru „robots.txt“ nachází příkaz „Disallow“ pro všechny roboty, nebo alespoň pro Googlebot, stránky nebudou vůbec zařazeny do indexu. Nemohou se tedy nikdy ukázat ve výsledcích. Zajistěte, aby se stránky, které chcete mít ve výsledcích, do indexu dostat mohly.
Reputace domény
Je možné, že jste si doménu registrovali a již měla nějakou historii před tím. Možná, že předchozí majitel dostal ban za nějaké neetické techniky. Bude těžké přesvědčit Google, aby od banu upustil, jen proto, že doména změnila majitele.
Přesměrování pomocí JavaScriptu, nebo Meta Tagu
Velmi dobře zdokumentovaná zakázaná technika. Mnohdy je v tom majitel stránek nevinně, kdy zaregistruje více domén s podobným názvem a na každou jen dá soubor s příkazem k přesměrování. Jde ale o podobný problém jako Doorway. Uživatelé jsou zmateni, míra okamžitého opuštění webu je 100% a nikomu to nepřináší prospěch. Správnější je přesměrovat přímo doménu na úrovni serveru s kódem 301, nebo 302 pokud jde jen o dočasné přesměrování.
Výpis textu JavaScriptem
Jakkoli Google pokročil a stále pracuje na procházení a pochopení JavaScriptů, je pořád velmi pravděpodobné, že nebude umět pochopit celý JavaScript. Pokud je JavaScript použit na výpis všech textů na stránce, bude při zobrazeném HTML kódu vidět jen několik příkazů pro vložení skriptů. Žádný indexovatelný text. Není to tedy přímo nekalá technika, ale celkem jistě to stránkám neprospěje.
Nedostupné stránky
Pokud se robot vyhledávače nedokáže dostat na stránky, nemůže je indexovat. Je-li web často, nebo delší dobu, nedostupný, bude negativně hodnocen a po čase úplně vyřazen z indexu.
Příliš mnoho odkazů
Uvedení přiměřeného počtu odchozích odkazů je hodnoceno pozitivně jako snaha o budování kvalitního obsahu. Pokud je ale odchozích odkazů příliš, nejen že se snižuje PageRang , ale z původně pozitivního hodnocení se stane negativní. Všeho moc škodí. Do jisté míry to pravděpodobně platí i o vnitřních odkazech.
Chyby v HTML kódu
Chybovost kódu do řazení výsledků nijak nezasahuje, jak potvrdil Matt Cuts. Ale opatrně s tímto tvrzením – důsledky některých chyb mohou k penalizaci vést. Takže pokud v HTML chybu uděláte a ta způsobí, že se třeba text nevykreslí, nenačtou se některé scripty apod., může to mít následky.
Affiliates odkazy
Kolem partnerských odkazů panuje nejasno – od pohody po paranoiu. Je tedy na místě uplatnit univerzální radu – všeho moc škodí. V Google sice přijali opatření proti odkazům, které neposkytují žádnou přidanou hodnotu, ale těžko říci, jak který konkrétně hodnotí.
Zaparkované domény
Zaparkovaná doména je taková, kterou si sice někdo registroval, ale žádné stránky na ní zatím neběží. Používali to spekulanti, kteří počítají s tím, že případným budoucím zájemcům doménu prodají se ziskem. Google jasně deklaroval, že takové domény do indexu zařazovat nebude.
Stránky s výsledky vyhledávání
Google se snaží poslat uživatele na co nejkonkrétnější stránku a ne na stránku, která vypadá podobně jako jeho výsledky hledání. Uživatel, který na Google zadá nějaký výraz a kliknutím se dostane na portál, kde vidí vlastně podobný výpis, ze kterého přišel, nebude rád. Google takové stránky nebude nabízet ve výsledcích.
Automatický generovaný obsah
Už jste někdy navštívili stránku, na které se přesně na několika místech vyskytoval váš hledaný dotaz, a hned vzápětí ji našli na jiný dotaz a ten se zase na stránce objevil? Obsah byl totiž strojově vygenerován. To je přísně zakázaná technika, která má prozatím jedinou výjimku a to jsou meta tagy. Ale dlouhodobě bych nespoléhal ani na to.
Viry, mallware, phishing
Stránky, které jsou zavirované a mohou tak uživatele poškodit, nebude Google samozřejmě dlouhodobě nabízet svým uživatelům ve výsledcích. Zatímco stránky mohou být napadeny i bez vědomí majitele, phishing je cílený útok. Majitel vytváří stránky, které kopírují vzhled jiných stránek se snahou zmást uživatele. Nejčastěji přihlašovací stránka do internetového bankovnictví. Nejen, že je čeká okamžitý tvrdý ban, ale jde přímo o trestný čin.
Placené odkazy
Matt Cutts prezentoval případovou studii, kde ukazuje jak se PageRang domény snížil ze sedmi na tři jako přímý důsledek placených odchozích odkazů. Jde o přímé porušení zásad pro webmastery. Přičemž penalizace postihne pravděpodobně obě strany – jak web, na kterém jsou placené odkazy umístěny, tak weby, na které odkazy vedou.
Chybové kódy 4xx a 5xx
Při pokusu o navštívení neexistující strany by měl být uživatel a potažmo i robot vyhledávače, upozorněn, že stránka neexistuje. Mnoho stránek ale zobrazí hlášení ve smyslu, že požadovaná stránka neexistuje, ale toto hlášení se objeví na stránce s kódem 200. Kód 200 ale říká, že se stránka v pořádku zobrazila. Google tak nemá jasno, zda stránka existuje či ne. Pokud indexuje např. 50 stránek, které už ale na webu nejsou, dostane vždy stejnou informaci – stránka existuje. Všech 50 stránek má ale stejný obsah a jsou tedy duplicitní. Následuje penalizace celého webu.
Odchozí odkazy
Existuje představa, že jakýkoli zpětný odkaz na mých stránkách mi ubližuje, protože snižuje PageRank. Pominu fakt, že PageRank nijak významně neovlivňuje řazení výsledků a poukážu na vyjádření Matta Cuttse. Ten potvrdil, že přiměřený počet kvalitních odchozích odkazů naopak zlepšují pozice stránek, protože webové stránky mají být křižovatky a ne slepé uličky.
Chybějící robots.txt
Pokud robots.txt na stránkách chybí, Google radí majitelům jak jej vytvořit a umístit. jeho účelem je ukázat robotům co mají a co nemají indexovat. Nicméně pokud chcete, aby roboti indexovali vše, je nejjednodušší robots.txt zcela odstranit. Stejně jde jen o žádost vůči robotům a někteří méně slušní ji ignorují a snaží se indexovat cokoli, co jde.
Všechny odchozí odkazy s nofollow
Odkazy s atributem nofollow říkají vyhledávačům, aby je nenásledovaly. Stránka, na kterou odkaz vede, pak nemá takový odkaz jako příchozí a takový odkaz nesnižuje náš PageRank. Google sice podle všeho nofollow odkazy netrestá, ale stránky mohou ztratit něco z kladného hodnocení za kvalitní odchozí odkazy.
Pozitivní off-page faktory
Autoritativní příchozí odkazy na stránku
Larry Page potvrzuje, že odkaz, který vede ze stránky, na niž samotnou míří velké množství odkazů, je cennější, než ze stránky, na kterou tolik odkazů nevede.
Další příchozí odkazy na stránku
Je vždy dobré využít možnosti mít další zpětný odkaz, pokud nevede z problematické, nebo penalizované stránky. Kvalita ale přebíjí kvantitu. Podle Larryho Page může být velké množství odkazů doslova bezcenné oproti jednomu odkazu z autoritativní domény s relevantním obsahem
Stabilně trvající odkaz
Odkaz, který má za sebou již nějakou historii, je cennější, než odkaz nový. Existuje patent, který upřednostňuje odkazy starší oproti nově vzniklým.
Anchor text odkazu
Anchor text pomáhá zvýšit relevanci odchozího odkazu. Nemusí přímo obsahovat klíčové slovo v přesné shodě, ale měl by podporovat dané téma.
Odkazy z relevantní stránky
Odkazy ze stránek, které se věnují podobnému tématu jako vy, budou ceněny výše, než jiné.
Částečné shody klíčových slov
Přesná shoda klíčového slova v anchor textech či, alt popiscích obrázků nebudí dojem přirozenosti. Je jasné, že každý uživatel, který zadává sám odkaz na jinou stránku, protože ji považuje za přínosnou, zvolí velmi pravděpodobně trochu jiné slovní spojení. Není úplně potvrzeno, že rozmanitost textů přímo ovlivňuje řazení, ale podporuje přirozenost a ta je hodnocena kladně.
Klíčové slovo v atributu „title“ u odkazu
Někteří webmasteři se domnívají, že uvedením klíčového slova do atributu „title“ u odkazu zvýší jeho hodnotu. Tak to ale není, jak už v roce 2005 Google jasně potvrdil. Vyplněním tohoto atributu sice neporušíte žádný pokyn, ale ani si nijak nepolepšíte.
Klíčové slovo v atributu „alt“ u obrázku
Uvedením klíčového slova do atributu „alt“ u netextových prvků naopak velmi zvýšíte jejich hodnocení.
Kontext odkazu
Význam zpětného odkazu je ovlivněn okolním textem, který odkaz obklopuje. Tuto skutečnost podporuje patent Google i testy. Je velmi pravděpodobné, že hodnota odkazů stoupá spolu s relevantním textem, který odkaz obklopuje.
Záznam v DMOZ
Ze všech možných katalogů je DMOZ ten, kam byste chtěli svůj zpětný odkaz umístit. Je ovšem téměř zázrak, když se vám to povede a noční můra se o to snažit. Ačkoli není přímo potvrzeno, že by se jednalo o jedno z hodnotících kritérií při řazení, jde o velmi cenný odkaz.
Růst počtu odkazů
Počet odkazů se v čase mění – přibývají nové, ale i miznou ty, co se nám už podařily získat. Někdo je prostě odstraní, umře celý web, kde jsme je měli, nebo o odstranění požádáme my. Pokud se ale děje to, že v průběhu času celkový počet odkazů přiměřeně trvale roste, je to známkou kvality a ta může být pozitivně hodnocena.
Nízká míra okamžitého opuštění
Jakkoli Google tvrdí, že míru okamžitého opuštění ani neměří, ani nehodnotí, některé experimenty naznačují opak. V každém případě Bing tomu důležitost přikládá. A okamžité opuštění není žádoucí ve většině případů.
Sociální sítě a vazby
Mít stránky provázané se sociálními sítěmi je dobrý tah. A to, i kdyby ikonka, nebo sociální plugin na webu, nijak přímo neovlivnil řazení. Případné zpětné odkazy ze sociálních sítí jsou totiž dobře hodnoceny zejména proto, že velmi pravděpodobně vznikají přirozeným sdílením. Na druhou stranu představa, že samotná registrace do mnoha sociálních sítí nějak ovlivní řazeni, je naivní.
QDF
Google nezpracovává každý zadaný dotaz stejným způsobem. Určité vyhledávací dotazy mají jiný charakter. Uživatelé hledají nejčerstvější novinky k nějaké aktuální situaci. Pokud by například vybuchla nějaká sopka a způsobila významné potíže, dá se čekat, že se ve výsledcích objeví weby, které se věnují přímo tomuto konkrétnímu tématu a přeskočí dočasně i Wikipedii.
Mapa stránek
Ačkoli Google doporučuje vložení mapy stránek, neslouží tato pro vylepšení pozic. Mapa stránek jen umí na jednom místě předat vyhledávačům kompletní strom stránek na webu a tak zrychlit indexaci. Robot nemusí sám procházet celý web pomocí vnitřních odkazů. Pokud nějaký profit nastane, tak ten, že se z většího počtu zaindexovaných stránek některá umístí na přední pozici ve výsledcích hledání.
Negativní off-page faktory
Nadměrné Cross-Site prolinkování
Pokud vlastníte více domén, je těžké odolat pokušení prolinkovat je všechny mezi sebou stylem každá s každou. Takové nepřirozené odkazy jsou ale většinou rychle odhaleny – výpisem z Whois dotazu, stejná IP adresa, podobný obsah, dokonce podobný návrh, to vše naznačuje tvorbu tzv. incestních odkazů. Takové Google trestá, pokud neobhájíte, že k tomu máte důvod, který je pro uživatele prospěšný.
Google Bowling
Tato metoda používá neetické praktiky ke zhoršení stránek konkurence. Snahou je poškodit je a profitovat na jejich vyřazení z indexu. Princip je jednoduchý – zřídit odkazy z nekvalitních, nebo přímo z penalizovaných stránek a vést je na stránky konkurence. Není snadné odhalit souvislost se škodlivým odkazem a jeho vkladatelem. Ovšem pokud se to podaří, jeho stránky nenávratně zmizí z indexu.
Placené odkazy
Je proti pravidlům kupovat si zpětné odkazy od majitelů jiných stránek. Při zjištění takových zpětných odkazů obdrží postih obě strany – odkazující i odkazovaná.
Měnící se anchor text
Pokud odkaz ve stejném tvaru nevydrží na svém místě alespoň pár měsíců, vnímají to vyhledávače negativně. Může to naznačovat zakoupený odkaz, nějaké zapojení do dynamicky se měnících odkazů v linkfarmách, nebo prostě nějakou snahu o manipulaci s výsledky vyhledávání.
Nízký Pagerank na stránce s odkazem
Algoritmus PageRanku rozděluje celkovou váhu stránky mezi ty, které jsou vzájemně propojeny odkazy. Například stránka s jediným odkazem může předat hypoteticky PageRank 1, zatímco stránka s tisícem odkazů jen 0,001. odkaz z takové stránky pak nebude mít žádnou hodnotu.
Komentářový spam
Zapojit se do komentářové diskuze k nějakému tématu je v pořádku. Na druhou stranu dělat to jen proto, aby bylo kde uvést zpětný odkaz, je krátkozraké. Google takové opakující se a často i strojově vytvářené komentáře vyhodnotí jako spam a cílové stránky penalizuje.
Reciproční odkazy
Odkazy, které vznikají výměnou, také Google považuje za nepřirozené. Nepřináší vám žádný větší zisk.
Odkazy z linfarem
Kdysi tak populární lištičky a výměnné systémy odkazů dnes stránky poškozují. Ozývají se zoufalí majitelé stránek, kteří se kdysi někam zaregistrovali, a nyní na ně míří odkaz, který jim škodí a který nelze odstranit.
Rychlý nárůst počtu odkazů
Růst počtu odkazů je žádoucí. Dle slov patentu Google ale „pokud je nárůst odkazů nápadně rychlý, poukazuje to na spam“. Je nepravděpodobné, že rychlý nárůst odkazů je přirozený a takové stránky většinou projdou důkladnější prověrkou.
Rychlý pokles počtu odkazů
Stejně jako rychlý nárůst, i rychlý pokles počtu odkazů může ukazovat nějakou snahu o manipulaci s výsledky hledání. Majitel stránek by měl čekat kontrolu a případný postih.
Odkazy z nerelevantních stránek
Bylo by fajn mít odkazy jen z relevantních a autoritativních stránek. Ale takový web neexistuje. Proto jsou běžné i odkazy z nerelevantních stránek a jejich existence nepřekvapí ani Google. Ovšem příliš velké množství takových odkazů vede k domněnce, že nevznikly přirozeně.
Odkazy z penalizovaných stránek
Google již dlouho používá termín „bad neighborhoods“ pro popis vztahů mezi penalizovanými stránkami. Pokud na vaše stránky vedou odkazy od takových „špatných sousedů“, přitahuje to nežádoucí pozornost a větší pravděpodobnost ručního či automatického zásahu.
Negativní vyjádření ke značce
V roce 2010 Google potvrdil, že vyjádření ke značce (například hodnocení či recenze), bude považovat za faktor pro řazení ve vyhledávání. Není však jisté jak významný je to činitel.