zahraniční vyhledávače: historie, současnost, trendy Kdo hledá, najde? Yahoo!, Altavista, Excite, Infoseek - jména neodlučitelně spojená s pojmem vyhledávací servery již od počátku internetové revoluce. Od té doby se však mnohé změnilo. Některá jména pohasla, jiná si stále udržují svůj hvězdný lesk a usnadňují uživatelům navigaci v moři informací a stránek, které dnešní internet nabízí. Webových stránek neustále přibývá. Odhady se různí, nicméně podle expertů dnes existuje na internetu něco kolem dvou až čtyř miliard WWW stránek. Na internetu proto vznikla celá řada vyhledávacích a katalogových serverů, které se snaží uživatelům napomoci při hledání v tomto mnohdy nepřehledném prostoru informací. Mezi historicky nejstarší katalogy na internetu patří Yahoo!. Byl založen v dubnu 1994 a postupem času se transformoval na portálový server nabízející více než dva tucty různých internetových služeb a aplikací. Yahoo! dnes patří mezi nejnavštěvovanější servery na internetu. Transformací na portál prošly také Excite, Lycos a Infoseek (dnešní Go.com). Kdysi populární WebCrawler byl v roce 1995 prodán a dnes je součástí portálu Excite. Podobně HotBot, původně provozovaný časopisem Wired, přešel v minulém roce pod Lycos. Podobu čistě fulltextového vyhledávacího serveru si do dnešního dne uchovala pouze AltaVista. I ta však prošla spletitou cestou neúspěšných pokusů o transformaci na portálový server a její popularita dnes pomalu klesá. Druhá polovina devadesátých let přinesla novou vlnu vyhledávacích serverů. Firma Netscape se vrhla do oblasti vyhledávačů v srpnu 1998, krátce po uvedení verze 4.06 svého prohlížeče Netscape Navigator. Tehdy nová verze Navigatoru umožnila zadávat klíčová slova namísto celé URL adresy hledaného dokumentu. Vložená klíčová slova byla potom zpracována vyhledávacím mechanismem serveru Netscape Netcenter. Také firma Microsoft uvedla svůj vlastní portálový server MSN.com. Do sítě MSN dnes patří také jeden z nejznámějších e-mailů - Hotmail. Portál MSN prodělal v tomto roce několik drobných změn. E-mailový server Hotmail změnil image a přidal některé nové služby. Ke změnám došlo také ve způsobu vyhledávání. Microsoft uplatnil podobnou strategii jako Netscape a propojil Internet Explorer se svým vyhledávacím centrem MSN Search. Pokud hledaný WWW server nebo stránka nejsou nalezeny, Internet Explorer automaticky přesměruje dotaz do MSN. Poněkud odlišným typem vyhledávače je server GoTo.com. Provozovatelé tohoto serverů jako první zrealizovali myšlenku aukčního prodeje odkazů v databázi WWW stránek. GoTo.com tak ukazuje u většiny linků ze svého katalogu cenu, kterou majitel odkazu platí za každého uživatele internetu, který si na odkaz klepne. Placené odkazy tak v podstatě fungují jako reklamní proužky, a zatímco většina vyhledávacích serverů seřazuje výsledky dotazu podle počtu nalezených klíčových slov na stránce a podle popularity daného odkazu, GoTo řadí odkazy podle ceny. Tvůrci GoTo předpokládali, že komerční firmy se ve snaze o lepší umístění ve výpisu odkazů začnou vzájemně přeplácet a hnát cenu za jedno klepnutí na odkaz do neskutečných výšin. V době vrcholu internetové horečky (na přelomu let 1999 a 2000) tak tomu skutečně bylo a aukční ceny se v některých kategoriích (např. počítače, auta) vyšplhaly až na 5 dolarů za jedno klepnutí! V dubnu 2000 však přišlo první ochlazení a během dalšího roku se situace zvrtla do opačného extrému. Ceny za odkazy se snížily nejen díky krachu mnoha rádoby "perspektivních" internetových firem, ale také díky tichým kartelovým dohodám platících firem o synchronizovaném snižování svých nabídek na placené odkazy. Dalším netradičním vyhledávacím serverem druhé vlny je AskJeeves. Zatímco většina vyhledávačů hledá odkazy na stránky podle klíčových slov nebo krátkých frází, AskJeeves vybudoval systém, který vyhledává na základě celých vět. Lépe řečeno, podle souvislých otázek kladených v anglickém jazyce. Například na otázku "Who is George Bush?" AskJeeves pohotově zobrazí odkazy na stránky popisující současného amerického prezidenta, Bílý dům nebo stránky s přehledem dosavadních amerických prezidentů. Pokud je otázka příliš abstraktní, případně obsahuje příliš mnoho gramatických chyb, nabídne AskJeeves uživateli alternativní otázky, které by měly napomoci při hledání daného tématu. Devadesátá léta nebyla úspěchem pro všechny. Typickým příkladem je server NorthernLight. Tento fulltextový vyhledávač byl spuštěn v srpnu roku 1997 a již v červnu roku 1999 se mohl pochlubit nejbohatší databází zindexovaných stránek (150 mil.). Ostatní vyhledávače však nelenily a Northern Light byl brzy předehnán AltaVistou a dalšími servery. Snad díky špatnému marketingu se Northern Light nedostal do povědomí uživatelů internetu a dnes jej používá necelé jedno procento lidí. Mnohem úspěšnějšími projekty se staly vyhledávače FAST a Google. Oba servery mají stejné zaměření - nesnaží se vybudovat portál, ale specializovaný vyhledávací server s velkou databází zindexovaných stránek. Uživatelské rozhraní obou serverů nehýří přemírou grafiky a reklam. Stránky jsou čisté, jednoduché a snadno ovladatelné (vlastnosti, které jsou mnoha nejen českým, ale i zahraničním serverům zatím naprosto cizí). FAST (AllTheWeb) byl založen v červenci roku 1997 v norském Oslu a spuštěn v polovině roku 1998. V březnu roku 2000 se stal na krátkou dobu vyhledávačem s největší databází zindexovaných stránek (300 mil.) a i v současné době si udržuje velmi dobré postavení. Podobně jako FAST také Google je úspěšným projektem druhé vlny vyhledávacích serverů. Byl založen v roce 1997 jako speciální projekt na standfordské univerzitě v Kalifornii, ale již v polovině roku 1999 našel investora a přesunul se z akademické půdy do komerční sféry. Google se dnes pyšní nejbohatší databází zindexovaných stránek (1,38 miliard). Svým fulltextem zásobuje mnohé vyhledávače a portály, z nejvýznamnějších jmenujme Yahoo! a Netscape. Popularita O pozornost uživatelů internetu dnes soutěží takřka dva tucty různých vyhledávacích serverů a portálů. Vývoj v oblasti oblíbenosti jednotlivých serverů sleduje několik prestižních analytických firem, které pravidelně několikrát ročně publikují výsledky svých průzkumů. Nejznámější jsou zprávy Jupiter Media Metrix a Nielsen Netratings. Obě firmy měří návštěvnost (oblíbenost) serverů na základě vzorku několika tisíců uživatelů internetu (především v USA). Vybraní uživatelé mají na svém počítači dobrovolně nainstalován software zaznamenávající jména serverů, které uživatel v daném měsíci navštívil. Z naměřeného vzorku se potom usuzuje na celkovou oblíbenost serverů (jelikož jeden uživatel navštíví za měsíc obvykle více než jeden WWW server, přesahuje celkový procentuální součet 100 %). Výsledky obou studií se mírně odlišují (viz tabulka), hlavní trendy jsou však patrné. Tabulku oblíbenosti vede portál Yahoo!. Každý měsíc jej navštíví zhruba 61,4 % (48 %) surfařů. Yahoo! si svou pozici udržuje již delší dobu. Na druhém místě se umístil portálový server sítě MSN (56,5 % a 38,5 %). Na současnou pozici se MSN vypracoval zhruba před dvěma lety a od té doby pomalu dohání Yahoo!. Na třetím místě (40,4 %) se umístil portálový server AOL provozovaný firmou America OnLine. Vynikající umístění serverů AOL a MSN nasvědčuje tomu, že tvorba vlastní fulltextové databáze nemusí být vždy hlavním tažným koněm návštěvnosti. Oba servery nedisponují vlastní fulltextovou databází (používají externí databázi firmy Inktomi), jejich provozovatelé jsou však zároveň poskytovateli připojení k internetu a své služby podporují silnou marketingovou kampaní. Do první desítky se dále dostaly vyhledávače Go (Infooseek), Google a portály Exite, Lycos a Netscape. Graf vývoje oblíbenosti v první polovině roku 2001 poukazuje na to, že největší boj o přízeň uživatelů probíhal mezi servery s oblíbeností pod 20 %. Hranici 15 % prolomily servery NBCi (bývalý Snap.com) a Excite. Pod hranici 10 % klesly servery AltaVista a LookSmart. Zatímco důvody propadu vyhledávače LookSmart nejsou známy, v případě AltaVisty se odbornícií shodují v názoru, že pokles oblíbenosti způsobily nedávné pokusy o transformaci v portálový server. Provozovatelé serveru AltaVista během posledních dvou let zřejmě hodně experimentovali. AltaVista několikrát změnila svou grafickou podobu a z pružného fulltextového vyhledávače se snažila stát se portálovým obrem. Dobrá zpráva - AltaVista se vrátila zpět k modelu čistě vyhledávacího serveru, je rychlá a opět rozšiřuje svou databázi stránek. Kromě mnoha propadů se v první polovině tohoto roku dočkalo několik serverů nebývalého růstu. Například popularita serveru GoTo vzrostla ze 7 % (leden 2001) na 11,8 % (květen 2001). Nebývalý nárůst zaznamenal také server Google (z 9 % na 14 %). Tento vyhledávač se stává poslední dobou populární nejen pro velikost své databáze, ale také svou jednoduchost a rychlost. Tolik čísla a statistické údaje. Nutno poznamenat, že ani statistiky oblíbenosti nejsou ideální. Měření obou analytických firem zahrnují celkovou návštěvnost portálových a vyhledávacích serverů. Tedy ne pouze ty návštěvníky, kteří využili vyhledávací službu daného serveru. Pokud by bylo nějakým způsobem možné tyto statistiky očistit, mnohé portálové servery by se zřejmě rychle propadly do druhé desítky návštěvnosti. První trojku nejnavštěvovanějších vyhledávačů by potom tvořily Google, GoTo.com a AltaVista. Martin Dvořáček martin.dvoracek@vogel.cz Yahoo! Portálový server Yahoo! založili David Filo a Jarry Yang z katedry výpočetní techniky kalifornské univerzity Standford v dubnu roku 1994. Zprvu šlo o jednoduchou aplikaci přístupnou na školní síti, která měla usnadnit administraci jejich vlastních odkazů (Yahoo! tehdy "běžel" na počítačích Akebono a Konishiki, pojmenovaných podle havaiských zápasníků sumo). David a Jarry na projektu pokračovali dále a už v srpnu téhož roku byl Yahoo! zpřístupněn všem uživatelům internetu. Název Yahoo! údajně vznikl jako zkratka pro Yet Another Hierarchical Officious Oracle. Poněkud neobvyklý název se rychle vžil (zřejmě pro snadnou zapamatovatelnost a melodičnost v anglickém jazyce) a marketingová kampaň s vedoucím sloganem "Do you Yahoo?" vytvořila Yahoo! nezaměnitelný image. Zájem o katalogový server rychle rostl, byly přidávány nové a nové služby. Během několika málo let se Yahoo! vypracoval na nejnavštěvovanější portálový server na internetu. AltaVista Server AltaVista vznikl v roce 1995 jako speciální projekt v laboratořích firmy DEC (Digital) v městečku Palo Alto v Kalifornii (dnešní Silicon Valley). Jméno AltaVista se zrodilo jednoho dne na tabuli umístěné v konferenční místnosti, která byla nedbale smazána. Název města Palo Alto bylo zčásti umazáno a na druhé části tabule zbylo slovo Vista. Někdo v místnosti zcela spontánně navrhnul pojmenovat server Alto Vista. Po zralé úvaze byl nakonec schválen název AltaVista. Nikdo tehdy ještě netušil, kolik uživatelů server pojmenovaný podle nedbale smazané tabule přitáhne. AltaVista byla hned po svém startu na špici technologického vývoje. Jako živý důkaz výpočetní síly procesorů Alpha (a 7GB operační paměti) dokázala prohledávat svou fulltextovou databázi stránek neskutečnou rychlostí. AltaVista jako první nabídla vyhledávání ve WWW stránkách podle jazyku země, v němž byla stránka napsána. Jako první dokázala (pomocí překladače Babel Fish) vyhledávat stránky v čínštině, japonštině a korejštině. Jako první mezi vyhledávacími servery disponovala automatickým překladovým slovníkem pro slova, fráze a celé věty (i když ne zcela přesně). V lednu roku 1999 byla AltaVista přičleněna pod Compaq (společně s koupí firmy DEC). infotipy: Excite Search Voyeur - www.excite.com/search/voyeur Inktomi WebMap - www.inktomi.com/webmap Jupiter Media Metrix - www.jmm.com Nielsen//Netratings - www.nielsen-netratings.com Web Characterization - wcp.oclc.org