Vyhledávače.info » Poradna » Optimalizace pro Seznam.cz » Seznam - diakritika
Seznam - diakritika
| Autor | Zpráva |
|---|---|
| originalix Člen |
Dobrý den. Mám otázečku.
Zajíbalo by mě, zda Seznam nějak rozlišuje výrazy s diakritikou a bez. Vlastně abych byl upřímný, v minulosti mi seznam na má klíčová slova vyhazoval totožné výsledky, i když jsem je zadával s diakritikou i bez ní. Momentálně se ale situace změnila a při zadání slov bez háčků a čárek mi Seznam vyhodí zcela odlišné výsledky (méně kvalitní weby, tématicky o dost dál). Nějak jsem nezaregistroval, kdy se tak začal chovat?? Nic méně, nejsou tím trochu znevýhodněni lidé s anglickou klávesnicí, nebo anglickým nastavením? A nějaké rady, jak optimalizovat web aby se zobrazoval ve vrchních pozicích i v případě zadání bez diakritiky a zároveň jsem v obsahu nemusel odebírat háčky a čárky? Díky za odpověď. #1 Zasláno: 29.9.07 23:53 - Změnil/a: originalix |
| Marek Prokop Moderátor |
Diakritika představuje pro vyhledavače nepříjemný problém. Pokud vyhledavač na dotazy lišící se jen diakritkou vrací stejné výsledky a ještě navíc mechanicky, podle slovníku a gramatiky, ohýbá slova, přesnost hledání znatelně klesá. Proto se dá očekávat, že se pokročilejší vyhledavače pokusí co nejlépe odhadnout smysl dotazu a podle toho se zachovají.
Zdá se, že Seznam se již o určitou diferenciaci pokouší (pokud se nejdená o náhodnou či dočasnou anomálii). Např. dotazy účetnictví a ucetnictvi vracejí nyní na první stránce zcela stejné výsledky, zatímco výsledky dotazů česká spořitelna a ceska sporitelna jsou různé. Uživatelé, kteří nemohou psát s diakritikou, tím nepochybně znevýhodněni jsou, nicméně důsledné slučování dotazů s a bez diakritiky snižuje kvalitu vyhledávání všem ostatním a těch je asi víc. Text bez diakritiky můžete na vlastní stránky nenásilně dostat např. pomocí uživatelských komentářů. Nepovažoval bych ale za zásadní nedostatek, když ho tam mít vůbec nebudete. Tohle je spíš problém samotných vyhledavačů než majitelů webů a SEO. #2 Zasláno: 30.9.07 10:03 |
| Yuhu Člen |
Někdy koncem prázdnin se v Seznamu nasazovaly nové lexikony. Asi nemá smysl chodit do detailů, jsou to prostě nějaké součástky. Je možné, že se chovají trochu jinak než ty lexikony staré.
Obecně se dá říct, že se někde něco blbě disambiguluje při lemmatizaci. Česky řečeno: špatně to uhodne základní tvar slova. Nebo ještě jinak řečeno: chybějící diakritika může hodně ztížit uhodnutí správného lemmatu (základního tvaru slova). Nekoukal jsem na podrobnosti, ale v tom příkladu ceska pojistovna se asi hledač seznamáckého fulltextu domnívá, že jsou hledána slova Češka pojišťovna tedy Češka bez Češky a nikoli česká bez české. Je těžké tohle vyhledávač naučit dělat automaticky úplně bezchybně. V dost případech to funguje správně. Až bude ve fulltextu víc programátorů, snad bude čas i na vylepšení disambigulace. Doporučení pro optimalizaci? Počkat, až se tyhle komponenty nějak dodělají. Já osobně bych to na stránkách fakt neřešil. Ale neznám mezní náklady a výnosy, takže nevylučuju, že by se tahle optimalizace někomu mohla vyplatit. #3 Zasláno: 1.10.07 3:55 |
| originalix Člen |
Díky.
#4 Zasláno: 1.10.07 12:55 - Změnil/a: originalix |