Vyhledávače.info » Poradna » Optimalizace pro Seznam.cz » Problém s INDEXACÍ
Problém s INDEXACÍ
| Autor | Zpráva |
|---|---|
| martin_tuma Člen |
Dobrý den,
mám za úkol kontrolu správné indexace webu http://www.pneu-jenda.cz/. Stav webu: - cca 15.000 obsahových stránek - validní URL - stemap - http://www.pneu-jenda.cz/sitemap - XML sitemap http://www.pneu-jenda.cz/sitemap.xml - (idexová) Před cca 2 měsíci se provedla změna URL na "čisté" a doplnění kompletní XML sitemap v té době bylo na seznamu za-indexovaných cca 3500 stránek. Vývoj je takový že stránek průběžně ubývá (nyní cca 1600) a pozice se skokově vylepšují. Tento nelogický vývoj absolutně nechápu! Několikrát jsem zkoušel vývoj zvrátit opakovaným přidáváním do fulltextu, ale beze změny. Aby nedocházelo k duplicitě starých a nových adres, tak se na staré URL nastavila 404. Bavil jsem se i s bývalým programátorem ze Seznamu a ten říkal, že toto může být nedostatečným počtem indexovacích serverů a že s tím Seznam míval dost problémy. Pokud můžete, tak poraďte! Díky Martin T. #1 Zasláno: 10.2.10 18:31 - Změnil/a: martin_tuma |
| petrox Člen |
Dobrý den,
Aby nedocházelo k duplicitě starých a nových adres, tak se na staré URL nastavila 404. Tohle je velmi riskantní postup. Lepší je zavést přesměrování přes 301 - tím řeknete robotovi, že stránka nezmizela, ale přesunula se jinam. Robot to pak snáze pochopí a nedojde ke situaci, kdy stará zahodí a nová nestihne založit. Vývoj je takový že stránek průběžně ubývá (nyní cca 1600) a pozice se skokově vylepšují. To, že stránek se do vyhledávání dostane 1600 ještě neznamená, že v DB fulltextu jich není víc. Ale do hledání se nemohou dostat, protože robot narazil právě třeba na 404 a teď čeká, jestli se náhodou nepodaří stránku příště znovu zpracovat. V takovém případě by ji zase do hledání přidal. V opačném případě ji definitivně zahodí. Doporučil bych změnit 404 - tedy obyčejné stránka nenalezena na 301 - stránek byla trvale přesunuta. Pokud mohu soudit, tak Seznambot v současné době běží "v normě" resp. nemá žádné zásadní výpadky. #2 Zasláno: 11.2.10 9:41 - Změnil/a: petrox |
| martin_tuma Člen |
Dobrý den,
děkuji za odpověď, ale nyní již v indexu seznamu (http://search.seznam.cz/?sourceid=szn-HP&thru=&q=site%3Awww.pneu-jend a.cz) žádné staré stránky nejsou a tak by to teď nemělo valný smysl. Při řešení obdobného problému do budoucnu využiji přesměrování přes 301. Ještě mi vyvstal jeden možný problém. http://www.pneu-jenda.cz/sitemap.xml vrací podle Seznamu stav "401 disallowed by robot rules", vím co znamená kód 401, ale pokud by tomu tak bylo, tak bych chybu měl dostat i v prohlížeči, jako např.: (http://www.pneu-jenda.cz/includes/) NE? Něco obdobného by mělo být s http://www.pneu-jenda.cz/sitemap-obsah.xml , která podle Seznamu vrací 404. Obě mapy v prohlížeči fungují a Google si je bez problému načte. Nějaké nápady??? Martin T. #3 Zasláno: 11.2.10 17:25 |
| martin_tuma Člen |
Dobrý den,
<b>už jsem se s tím asi popral.</b> Stránky se na Seznamu začínají indexovat. Doporučení: "Pokud máte větší XML sitemap, tak požijte komprimaci" - (Seznam to má radši) V mém případě se soubor zmenšil z cca 3MB na 180 KB (což je výrazný rozdíl). Martin T. #4 Zasláno: 16.2.10 11:24 |