Vyhledávače.info » Poradna » Optimalizace pro Seznam.cz » Indexování Seznamu

Indexování Seznamu

Autor Zpráva
Anonymní
Vi nekdo, jak casto indexuje Seznam?
Je to vubec pevny udaj, nebo si dela, jak se mu zachce?
Dekuji

#1 Zasláno: 15.12.05 0:56

Jan Rozehnal
Člen
Podle mojich zkušeností probíhá indexace jednou za 7 - 14 dní (občas i měsíc). Není to nijak pevně dané.

#2 Zasláno: 15.12.05 12:38 - Změnil/a: Jan Rozehnal

Marty
Člen
Tuším že za poslední dva měsíce indexoval vždy jednou za 3 týdny, bloggeři z toho rostou...

Většinou je to spojené s poskakováním pozic ve SERP. Ale zdá se mi že v poslední době se to opravdu řídí podle toho, jak se Seznam zaměstnanci vyspí.

#3 Zasláno: 15.12.05 12:57

Marek Prokop
Moderátor
Předpokládám, že záměrem Seznamu je reindexovat stránky s frekvencí přímo úměrnou frekvenci jejich aktualizací a jejich S-ranku. Jiná věc je technické řešení, které může pokulhávat -- a obávám se, že skutečně pokulhává -- za záměrem.

#4 Zasláno: 15.12.05 14:01

Jan Rozehnal
Člen
Jak to Marku myslíte, za záměrem?

#5 Zasláno: 15.12.05 15:18

Marek Prokop
Moderátor
Možná jsem tu větu napsal trochu nesrozumitelně. Myslel jsem to tak, že Seznam sice zřejmě chce mít výsledky vyhledávání co nejaktuálnější a reindexovat proto často aktualizované stránky v krátkých intervalech, ale zatím se mu to příliš nedaří.

Ještě méně se mu ovšem daří indexovat nové stránky a weby. Jeho index je zatím z českých vyhledavačů (o Googlu nemluvě) nejmenší, což asi také není záměr.

#6 Zasláno: 15.12.05 15:58

Tomik
Člen
Ke mě chodí seznam bot zhruba jednou za 8 - 14 dní, ale také myslím, že to není pěvně dané.
Aktualizuji tak 2x, 3x do týdne, takže toto na to IMHO zatím nemá vliv.

#7 Zasláno: 15.12.05 21:06

Yuhu
Člen
Frekvence crawlování robotem Seznamu opravdu není pevně daná. Opravdu by měla záviset na tom, co zmiňoval Marek. Jenom bych asi upozornil, že ta přímá úměrnost neznamená lineární závislost.

Co se týká pomalého indexování nových webů, tak to je ovšem opravdu částečně záměr.

#8 Zasláno: 16.12.05 0:06

Jan Rozehnal
Člen
Yuhu, prozradíte z jakého důvodu Seznam schválně zdržuje stahování nových stránek?

Já myslel, že vyhledávače chtějí nabízet kvalitní služby -> mít obsáhlý index.

#9 Zasláno: 16.12.05 0:13

Marek Prokop
Moderátor
Dušane, než případně odpovíš na otázku, proč je pomalé indexování nových webů částečně záměr, měli bychom si vyjasnit, co to je nový web resp. nová stránka. Já jsem tím ve svém příspěvku 6 myslel weby/stránky nové pro Seznam, tj. dosud chybějící v jeho indexu, nikoli weby/stránky vzniklé nedávno.

#10 Zasláno: 16.12.05 7:41 - Změnil/a: Marek Prokop

Yuhu
Člen
Marku, většina stránek při odesílání údaje o svém stáří (last modified) neposkytuje buďto žádnou infromaci, nebo poskytuje informaci chybnou. Pro Seznam je tedy k nerozlišení, zda je stránka na webu dlouho nebo krátce.

Obecně se soudí, že obsah, který je na www déle, je mírně kvalitnější a poctivější (ve smyslu seo spamu), než obsah, který je na www nový. V zájmu robota je mít v indexu hlavně ty starší kvalitní stránky, takže se snaží rozlišit, co je nové a co staré, i když se to z hlaviček stránky obvykle nedozví. Pomiňme nyní oblast zpravodajství, to je jiná kapitola řešitelná jinými prostředky.

Následující úvaha není až tak jednoduchá: Pokud robot nacrawluje veškerý dostupný obsah www do určité míry (řekněme 80 až 90 %), potom s velkou pravděpodobností platí, že stránka, která je nově objevená robotem, je nová i na www. Takže s určitou pravděpodobností je méně kvalitní. Je tedy logické, že po nacrawlování podstatné části českého www se ochota robota Seznamu chodit pro nové stránky zpomaluje.

> Já myslel, že vyhledávače chtějí nabízet kvalitní služby -> mít obsáhlý index.

ano, ale ještě důležitější než obsáhlost indexu je jeho kvalita. Mít v databázi 100 miliónů URL je sice dobré pro marketing, ale tím výhody končí. Víc nejsem ochoten prozradit.

#11 Zasláno: 19.12.05 2:28

Marek Prokop
Moderátor
Yuhu napsal:

Obecně se soudí, že obsah, který je na www déle, je mírně kvalitnější a poctivější (ve smyslu seo spamu), než obsah, který je na www nový. (...) Pomiňme nyní oblast zpravodajství, to je jiná kapitola řešitelná jinými prostředky.

Proč jenom zpravodajství? Co nové příspěvky v diskusích? Co nové zboží v e-shopech? Co nové zájezdy cestovek? Atd.

Pokud robot nacrawluje veškerý dostupný obsah www do určité míry (řekněme 80 až 90 %)...

Tady je asi zakopaný pes. Jak všichni víme, Seznam zatím oněch 80-90 procent nedosáhl ani zdaleka. Občas mám pocit, že se chová trochu jako jakýsi automatizovaný katalog -- z každého webu zaindexuje jen pár stránek a o další se nezajímá.

#12 Zasláno: 19.12.05 2:54 - Změnil/a: Marek Prokop

Pachollini
Člen
> většina stránek při odesílání údaje o svém stáří (last modified)

Jenom bych poznamenal, že HTTP hlavička last-modified neudává stáří stránky, ale datum poslední změny a používá se kvůli kešování. Pokud se server chová korektně, mění last modified např. při přidání příspěvku do diskuse pod článkem, i kdyby byl článek na webu už deset let. Pokud vím, samotné HTML nemá pro datum publikace žádnou značku (význam <meta name="date"> je IMHO nejasný)a bylo by asi potřeba použít Dublin Core metadata, což nejspíš opravdu nikdo nedělá.
Ale to je opravdu jen na okraj (OT).

#13 Zasláno: 27.12.05 21:41

petr
Člen
Indexace na seznamu se da o dost uspíšit pokud se to zada na http://fulltext.seznam.cz/ (pak to trva nekdy i 3 dny)

#14 Zasláno: 12.2.06 0:09

radek
Člen
Ahoj Petře,

nemyslím, že lze indexaci pomocí http://fulltext.seznam.cz/ nějak hodně urychlit urychlit. Podle toho co jsem zkoušel to příliš nepomáhá, důležitější jsou podle mě zpětné odkazy z silných webů a přidání stránek do katalogu.
Jediné co je opravdu bleskové je rychlost přenačtení náhledů po zadání stránek.

radek

#15 Zasláno: 16.2.06 9:50 - Změnil/a: radek

Jarda Z.
Přečetl jsem předcházející diskuzi a s politováním jsem zjistil že zdaleka nemám tolik znalostí abych mohl hovořit na vaší úrovni. Přesto bych byl rád, kdybyste na můj amatérský dotaz odpověděli, mělo by to pro mě velkou hodnotu. Uložil sem svoji stránku do katalogu a i do fulltextového vyhledávání. Ačkoli bylo v seznam emailu vyřčeno, že schvalování bude trvat okolo čtrnáctí dní - několik hodin na to jsem obdržel zprávu, že web byl schválený a do 24 hodin bude přidán do katalogu. Tak se také stalo. O web se starám, aktualizuji pravidelně každý den. Stránka je sice poměrně nová, několik dní, ale přesto je jediná svého druhu (týká se počítačové hry) - konrétně k této hře. Shrnuji odkazy z různých internetových deníků, překládám informace z oficiálních stránek, píšu svoje vlastní články, snažím se doplňovat každý nový obrázek ze hry, vše se snažím optimalizovat pro fultextové vyhledávání, meta names nechybí, každý obrázek je popsán pro dva různé prohlížeče. A přesto seznam není schopný moji stránku najít. Neviděl bych problém v neatraktivnosti témata. Jedná se o hru Spore, od Williama Wrighta, jednu z nejočekávanějších her tohoto roku. Grafická stránka je na průměrné úrovni a dal jsem do ní všechny své schopnosti. Akorát mi přijde že jdou vniveč. Možná se stresuji zbytečně, protže stránka je v katalogu teprve 6 dní. Nadruhou stranu by mi bylo líto, pokud by vydané úsilí přišlo vniveč a nikdo se na stránku nepodíval. Za jakoukoli radu budu vděčný. Pro kontrolu přidávám url http://spore.kytravel.cz (umístěno v kategorii - počítačové hry - abecední seznam - s - S TITULKEM SPORE). Předem děkuji za vysvětlení.

#16 Zasláno: 26.7.06 17:03

Jarda Z.
Omlouvam se za pokazenou url http://spore.skytravel.cz

#17 Zasláno: 26.7.06 17:05

Marek Prokop
Moderátor
Jardo Z., stresujete se opravdu zbytečně. Šest dní je rozhodně málo. Získávejte další zpětné odkazy a vyčkejte alespoň několik týdnů. Mezitím můžete odstranit rámce (frames), protože s nimi ve vyhledavačích moc štěstí neuděláte.

Příště prosím pro nový dotaz založte nové téma a zde již v diskusi nepokračujte.

#18 Zasláno: 26.7.06 17:32

Tomáš
"s velkou pravděpodobností platí, že stránka, která je nově objevená robotem, je nová i na www. Takže s určitou pravděpodobností je méně kvalitní."

Hmm, takže když jsem na webu změnil .html na .php a staré stránky .html odstranil (vïz. poznámka na konci), je takový web považován za nový, i když je TLD je stále stejná a obsah stále o tomtéž a minimálně stejně kvalitní? To mi nepřijde úplně korektní. Proč by mělo platit nové = automaticky pravděpodobně méně kvalitní?

Můj web má cca 200-300 stran. Před cca třemi týdny jsem musel do fulltextu znovu přidat novou vstupní stránku. Asi dva týdny se ve výsledcích ukazují pouhé dvě stránky. Místo dřívější pozice při hledání specifického klíčového slova kolem 10. místa jsem někde ve třetí stovce. Přitom zpětné odkazy jsou přibližně stejné kvality a množství jako dříve. Přede mnou je plno webů, které klíčové slovo obsahují třeba jen jednou na pouhé jediné stránce.

OTÁZKY:
a) Jak dlouho asi může trvat Seznamu zaindexování v uvedeném případě - kdy zase budu v top 10?
b) Je pro Seznam důležitější vnitřní (podotýkám, že rozmanitý, ne jen pořád dokola to samé) obsah webu, nebo vnější odkazy; resp. jakou má co váhu?
c) Pokud je vnější odkaz veden na domena.cz, je to nějakou úměrou zohledněno i v ranku adresy domena.cz/abc (a naopak)?

Předem děkuji za odpovědi.


Pozn. - možná někdo namítne, že jsem měl použít redirect. To mě ale tehdy vůbec nenapadlo. Jednak jsem měl za to, že když robot starou stránku nenajde, bude natolik inteligentní, že web znovu projede z index.html (Seznam bohužel té stránce přestal rozumět), a pak, nastavovat redirect na všech stránkách, z nichž některé jsou navštíveny jen párkrát za měsíc, mi přišlo absurdní (404 page mám vytvořenou, podobně mám informaci o nové adrese (s .php) na klíčových stránkách, ale bez redirectu - sám nemám rád, když mě nějaká stránka začne posílat někam, kam sám nechci). Google přeindexování zvládl vcelku bez problémů i bez těchto berliček.

#19 Zasláno: 2.8.06 15:31

Marek Prokop
Moderátor
Tomáši, vaše dotazy už buď byly v tomto vlákně zodpovězeny, nebo s ním nesouvisejí, nebo jsou příliš obecné. Pokud chcete s něčím konrétním poradit, založte prosím nové téma. Raději také pošlete adresu stránek, kterých se váš dotaz týká, protože bez ní často odpovědět nejde.

#20 Zasláno: 2.8.06 16:19

Toto téma je uzavřeno. Nemůžete zaslat odpověď.

TOPlist