Vyhledávače.info » Poradna » Optimalizace pro Seznam.cz » Problém s INDEXACÍ

Problém s INDEXACÍ

Autor Zpráva
martin_tuma
Člen
Dobrý den,
mám za úkol kontrolu správné indexace webu http://www.pneu-jenda.cz/.

Stav webu:
- cca 15.000 obsahových stránek
- validní URL
- stemap - http://www.pneu-jenda.cz/sitemap
- XML sitemap http://www.pneu-jenda.cz/sitemap.xml - (idexová)

Před cca 2 měsíci se provedla změna URL na "čisté" a doplnění kompletní XML sitemap v té době bylo na seznamu za-indexovaných cca 3500 stránek.
Vývoj je takový že stránek průběžně ubývá (nyní cca 1600) a pozice se skokově vylepšují.
Tento nelogický vývoj absolutně nechápu!

Několikrát jsem zkoušel vývoj zvrátit opakovaným přidáváním do fulltextu, ale beze změny.
Aby nedocházelo k duplicitě starých a nových adres, tak se na staré URL nastavila 404.

Bavil jsem se i s bývalým programátorem ze Seznamu a ten říkal, že toto může být nedostatečným počtem indexovacích serverů a že s tím Seznam míval dost problémy.

Pokud můžete, tak poraďte!

Díky Martin T.

#1 Zasláno: 10.2.10 18:31 - Změnil/a: martin_tuma

petrox
Člen
Dobrý den,

Aby nedocházelo k duplicitě starých a nových adres, tak se na staré URL nastavila 404.
Tohle je velmi riskantní postup. Lepší je zavést přesměrování přes 301 - tím řeknete robotovi, že stránka nezmizela, ale přesunula se jinam. Robot to pak snáze pochopí a nedojde ke situaci, kdy stará zahodí a nová nestihne založit.

Vývoj je takový že stránek průběžně ubývá (nyní cca 1600) a pozice se skokově vylepšují.
To, že stránek se do vyhledávání dostane 1600 ještě neznamená, že v DB fulltextu jich není víc. Ale do hledání se nemohou dostat, protože robot narazil právě třeba na 404 a teď čeká, jestli se náhodou nepodaří stránku příště znovu zpracovat. V takovém případě by ji zase do hledání přidal. V opačném případě ji definitivně zahodí.

Doporučil bych změnit 404 - tedy obyčejné stránka nenalezena na 301 - stránek byla trvale přesunuta.

Pokud mohu soudit, tak Seznambot v současné době běží "v normě" resp. nemá žádné zásadní výpadky.

#2 Zasláno: 11.2.10 9:41 - Změnil/a: petrox

martin_tuma
Člen
Dobrý den,
děkuji za odpověď, ale nyní již v indexu seznamu (http://search.seznam.cz/?sourceid=szn-HP&thru=&q=site%3Awww.pneu-jend a.cz) žádné staré stránky nejsou a tak by to teď nemělo valný smysl.
Při řešení obdobného problému do budoucnu využiji přesměrování přes 301.

Ještě mi vyvstal jeden možný problém. http://www.pneu-jenda.cz/sitemap.xml vrací podle Seznamu stav "401 disallowed by robot rules", vím co znamená kód 401, ale pokud by tomu tak bylo, tak bych chybu měl dostat i v prohlížeči, jako např.: (http://www.pneu-jenda.cz/includes/) NE?

Něco obdobného by mělo být s http://www.pneu-jenda.cz/sitemap-obsah.xml , která podle Seznamu vrací 404.

Obě mapy v prohlížeči fungují a Google si je bez problému načte.

Nějaké nápady???

Martin T.

#3 Zasláno: 11.2.10 17:25

martin_tuma
Člen
Dobrý den,
<b>už jsem se s tím asi popral.</b>
Stránky se na Seznamu začínají indexovat.

Doporučení:

"Pokud máte větší XML sitemap, tak požijte komprimaci" - (Seznam to má radši)

V mém případě se soubor zmenšil z cca 3MB na 180 KB (což je výrazný rozdíl).

Martin T.

#4 Zasláno: 16.2.10 11:24

(lze používat BBCode, ne Textile)

Ochrana proti spamu. Napište prosím číslici čtyři:

Heslo zadejte, jen pokud jste registrováni.