V minulém díle jsme se podrobněji věnovali vyhledávání na českém Internetu, dnes se podíváme do světa. Vyjmenovali jsme si některé z českých vyhledávacích centrál, některé z nich se již pomalu zapojují do celosvětového prohledávání Internetu, jiné zůstávají jen u prohlížení adres ve vrcholové doméně .cz. Začneme několika příklady těch největších amerických, na kterých však můžeme nalézt informace ze všech koutů světa. Například www.yahoo.com, www.altavista.com, www.lycos.com, www.excite.com, www.msn.com nebo třeba GoTo.com a mnoho dalších. Na těchto centrálách můžeme vyhledávat podobným způsobe jako na centrálách českých.
Nejprve bychom si je měli rozdělit na dva základní typy a to na katalogy a centrály databázového typu. V katalogových vyhledávačích nalézáme informace již roztříděné do kategorií, které nám usnadňují pohyb a orientaci. Majitelé stránek si je musí do těchto katalogů zaregistrovat pomocí formuláře a někdy sami určí kategorii, do které budou stránky zařazeny spolu s popisným textem. Protože však nikdo nedokáže zaregistrovat své stránky na všechny vyhledávače, mohou nám různé centrály poskytnout různé výsledky vyhledávání. Typickým příkladem katalogu je Yahoo!, které je dosti podobné českému Seznamu, který jsme si představili minule.
Druhou variantou jsou centrály databázového typu. Do těchto centrál se není třeba registrovat, protože si prohledávají Internet samy, respektive pomocí tzv. robotů, kteří postupně procházejí nové stránky a ukládají si o nich potřebné údaje do databáze (indexují je). I zde však existuje možnost, jak centrálu ‚navést' na vaše stránky pomocí zadání URL. V těchto centrálách nejsou údaje o jednotlivých stránkách tříděny do kategorií, zde hledáme pouze pomocí klíčového slova, centrála prohledá celou svoji databázi stránek, slovo od slova a zobrazí výsledek. Nevýhodou může být obrovské množství vyhledaných stránek, např. v řádech stovek tisíců, které není nikdo schopen prohlédnout. V tomto případě je vhodnější zadat složitější dotaz. Pro režim složených dotazů se používají různé operátory, např. AND (a současně), OR (nebo), NOT (ne), dále závorky nebo uvozovky, někdy také operátor NEAR (podobného významu). Vždy však záleží na tom, zda daná centrála operátory podporuje. Zkusíme-li například na Altavistě vyhledat všechny články o Václavu Klausovi s vyloučením těch, které se týkají poslanecké sněmovny, zadáme tedy dvě slova, "Václav +Klaus", znak "+" znamená současně, a ještě připíšeme -poslanec*, kde "-" vylučuje slovní řetězec začínající poslanec… Hvězdička je tedy u Altavisty znakem pro to, aby našel (eventuelně vyloučil) všechna slova začínající v našem případě výrazem poslanec, tedy také slovo poslanecká apod. Abychom ještě napomohli výsledku, zvolíme jazyk "Czech" - tedy prohledávání českých stránek. Tímto způsobem můžeme postupně zpřesnit náš dotaz, až dostaneme menší počet stránek obsahujících požadované informace.
Zatím jsme vyhledávali vždy jen na jedné centrále, existuje ovšem i možnost současně vyhledávat na více vyhledávačích. K tomuto slouží tzv. metaslužby, na kterých zadáme hledaný výraz - klíčové slovo - jen jednou a metavyhledávač jej předá dalším centrálám, aby provedly hledání. Aby mohla metaslužba pracovat dostatečně efektivně, je třeba také blíže uvést, co vlastně hledáme, například dokumenty, osoby nebo firmy, a jak mají být řazeny výsledky hledání. Výsledkem vyhledávání je seznam odkazů a u každého je uvedena také centrála, na které byl odkaz nalezen. Zde je několik příkladů: www.metasearch.com, www.metafind.com, www.savvysearch.com. Každá vyhledávací centrála má trochu odlišné použití, je dobré proto nahlédnout do nápovědy, kde najdeme operátory i rady, jak postupovat. Příště si povíme o dalších možnostech vyhledávacích centrál, o jejich doplňkových službách a o tom, co je to portál.
Slovníček pojmů:
Katalogová centrála - vyhledávací centrála, obsahující odkazy na internetové stránky tříděné do kategorií s popisem a přesnou internetovou adresou
Vyhledávací centrála databázového typu - vyhledávač, který si sám aktualizuje databázi prohledáváním Internetu pomocí tzv. robotů, lze na něm hledat převážně pomocí dotazů
Robot - automaticky fungující speciální program na prohledávání a indexaci internetových stránek
Indexace - evidování a řazení slov, která se vyskytují na každé jednotlivé internetové stránce, do databáze centrály
Operátor - spojovací znak, určující vzájemný vztah výrazů v zadání pro vyhledávání, napomáhá zpřesnění dotazu
Metaslužba - taková vyhledávací služba, která předá dotaz několika dalším centrálám a zobrazí výsledky vyhledávání od všech, seřazené a označené centrálou, na které byl odkaz nalezen