COMPUTERWORLD
Specializovaný týdeník o výpočetní technice
o Internetu
(CW 37/96)

Návštěva u Altavistů

Zbyšek Bahenský

Co je AltaVista, ví pravděpodobně každý jen trochu zkušenější uživatel Internetu. Nachází se na adrese www.altavista.digital.com a je to jednička mezi vyhledávacími nástroji. Když už zoufalý uživatel netuší, kde najít co hledá, obrátí se na AltaVistu a zadá jedno nebo více slov, která charakterizují to, co hledá. AltaVista mu obratem předá seznam míst na Internetu, která obsahují hledaný řetězec znaků a mohou tedy obsahovat vytoužené téma. Při nedávné návštěvě Kalifornie jsem se rozhodl AltaVistu vidět a promluvit s lidmi, kteří se o současný největší vyhledávací stroj Internetu starají. Po určitých komunikačních problémech, které provázejí novinářskou práci, se mi podařilo domluvit schůzku s Louisem Monierem, technickým ředitelem projektu AltaVista. Je deset hodin dopoledne a já vystupuji z vozu v Palo Altu. Právě v tomto městě, v garáži na Addison Avenue, založili pánové William Hewlett a David Packard firmu HP. Právě v tomto městě, v prvním patře krásného domu na Ramona Street sídlí AltaVista. Louis Monier mě zve do své kanceláře a povídání o AltaVistě začíná:

CW: AltaVista je pouze projektem společnosti Digital nebo je tu nějaký podíl např. Stanfordské univerzity, sídlící zde v Palo Altu?

Monier: Ne, AltaVista je výhradně záležitostí firmy Digital.

CW: Poprvé jsem se s AltaVistou setkal na Internetu někdy před koncem loňského roku, kdy jste ji začali provozovat?

Monier: Projekt AltaVista byl na počátku výzkumným projektem zaměřeným na vytvoření nejlepšího hledacího stroje na Internetu. Začali jsme na něm pracovat na jaře 1995. V prosinci 1995 jsme otevřeli vyhledávací službu na Internetu.

CW: Jak jste tento projekt začali, nepochybně nebyl od začátku výdělečný?

Monier: Projekt AltaVista přinesl Digitalu velkou přednost v oblasti marketingu. Žádnou formou reklamy nemohla být naše firma viditelnější v celosvětovém měřítku. Mimo jiné je to i možnost ukázat, že DEC má výkonné počítače a že jsme schopni psát dobrý vyhledávací software.

CW: Pak tedy nebylo příliš obtížné vysvětlit ředitelům firmy, že tento projekt je životaschopný a prospěšný...

Monier: Na začátku jsme začali s jediným počítačem, který nebyl příliš drahý. Když jsme službu prohledávání Internetu zpřístupnili, byl úspěch měřitelný počtem přístupů tak veliký, že naši šéfové uvěřili a dali projektu AltaVista k dispozici více finančních prostředků.

CW: Dobře. Podívejme se teď na to, jak AltaVista pracuje. Je-li kdesi na světě instalována na Internet nová domovská stránka, jak rychle bude vaším vyhledávacím strojem nalezena?

Monier: První možnost spočívá ve skutečném nalezení této stránky. Bude-li na novou stránku existovat nějaký odkaz, pak bude naším robotem nalezena. Těžko říci jak dlouho to bude trvat. Neexistuje-li na novou stránku žádný odkaz, je pravděpodobné, že nalezena nebude. Pak existuje druhá možnost -- přímé vložení její webové adresy do naší databáze. Na rozdíl od jiných vyhledávacích strojů AltaVista zařadí novou adresu ihned do databáze. Samozřejmě je také předána vyhledávacímu robotovi, který časem zaindexuje celý server.

CW: Můžete odhadnout střední dobu vyhledání nové stránky?

Monier: Snad několik týdnů.

CW: Takže mohu s určitou dávkou přibližnosti říci, že dotazem na AltaVistu najdu vše, co bylo na Webech na Internetu zhruba před měsícem?

Monier: To není tak docela triviální. Myslím, že se shodneme na tom, že webovský prostor je v podstatě nekonečný, obsahuje stamiliony webových stránek. Proto se AltaVista snaží nejprve vyhledat všechny možné servery a teprve ve druhé řady projít a zaindexovat webové stránky v nich obsažené.

CW: To znamená, že se AltaVista příliš nehodí k vyhledávání novinek např. v publikacích umístěných na Internetu?

Monier: Aby bylo možno vyhledávat novinky podle klíčových slov, bylo by třeba indexovat celý Web obsahující novinky opakovaně, např. každý týden nebo dokonce den, tak aby nový index obsahoval všechny potřebné změny. To je možné realizovat při lokálním prohledávání nebo na prohledávači specializovaném právě na novinky, který bude indexovat jeden nebo několik serverů s elektronickými médii. AltaVista a další obecné vyhledávací stroje se však hodí spíše na vyhledání informací, které se nebudou tak rychle měnit, protože není možné tak rychle vyhledávat všechny změny a opakovaně Indexovat celý "svět Webu".

CW: Co vlastně znamená název AltaVista?

Monier: Alta vista je španělský výraz a znamená vysoká vyhlídka. Nejedná se o nějakou horu ve Španělsku nebo v Mexiku, jak se občas domnívají někteří lidé na Internetu. Tyto mylné domněnky vznikly nejspíš při pohledu na naše logo. Designéři se při jeho návrhu inspirovali horou kdesi na Novém Zélandu. Ale ani s touto ani s jinou horou název AltaVista nespojujeme, volili jsme ho od počátku tak, aby ho uměly vyslovit všechny národy světa. Zvládnou to i Japonci, kteří mají ve své řeči nejméně zvuků, takže to nebude problém pro nikoho na světě.

CW: Indexujete nejen Web, ale také konference Usenetu. Jak dlouhou historii v nich udržujete?

Monier: To závisí na druhu konference -- některé jenom jeden den, jiné jeden nebo dva týdny, konference zaměřené na počítače ukládáme po dobu dvou a půl měsíce.

CW: V jakém jazyce je AltaVista programována a pod jakým operačním systémem běží?

Monier: Použili jsme jazyk C a operačním systémem je Digital Unix. Samotný hledací robot je poměrně malý, jeho zdrojový kód představuje méně než 10 tisíc řádek programu v céčku. Nejsem si jist, jak velký je indexovací nástroj, ale byl z 95 % psán dvěma lidmi, takže bude také poměrmě malý.

CW: Jaký je z organizačního hlediska rozdíl mezi AltaVistou -- vyhledávacím strojem a AltaVistou software? Jedná se o dvě různé divize?

Monier: Zhruba v březnu tohoto roku firma Digital založila jednotku Internet software business unit, což je druhé jméno pro jednotku AltaVista Software. Tato organizační jednotka nyní vlastní a provozuje vyhledávací stroj a vyvíjí řadu produktů založených na stejné vyhledávací technologii. Máme technologii pro indexování Intranetů všech rozměrů od velkých firemních sítí až po vlastní soubory na jednom počítači. Snažíme se o jednotné uživatelské rozhraní, takže uživatel si pouze vybere, zda chce prohledávat celý webovský prostor, Intranet své firmy, nebo jen vlastní počítač.

CW: Před nedávnem jste ohlásili zrcadlové servery AltaVisty, už jsou v provozu?

Monier: Ano, jeden se jmenuje Telia a sídlí ve Švédsku, druhý je Telstra a nachází se v Austrálii. To jsou zatím první dva. Uvažujeme o deseti, které by měly pokrýt celou planetu.

CW: Jaká bude nejbližší novinka na AltaVistě?

Monier: Většina dotazů na hledací server vyhledá mnohem více dokumentů, než by si člověk přál. Během září uvedeme novinku, která bude řešit tento problém. Věřím, že se vám bude líbit.

CW: Jak "silným kabelem" je AltaVista připojena do Internetu?

Monier: Nevím to přesně, ale bude to něco kolem dvou set megabitů za sekundu.

CW: Kolik dotazů AltaVista zpracovává?

Monier: Nedávno jsme dosáhli počtu jednoho milionu dotazů za den. Ve špičce to představuje 300-350 dotazů za sekundu.

CW: Jak mám rozumět tomu, že na Yahoo se objevilo vaše logo? Je snad Yahoo, vaše konkurence, jedním z vašich zrcadlových serverů?

Monier: Když použijete službu Yahoo k vyhledání nějakého častějšího pojmu, poslouží vám sama. Jakmile však budete hledat něco méně obvyklého, Yahoo dotaz předá naší AltaVistě a převezme od ní odpověď.

CW: Na jakém principu tato spolupráce funguje? Platí vám Yahoo za použití vašeho hledacího stroje?

Monier: Ano, říkáme tomu zrcadlový server s přidanou hodnotou. Mají přístup k naší databázi, mohou váš dotaz zpracovat před předáním AltaVistě a mohou ještě upravit odpověď AltaVisty. Samozřejmě, na tuto službu existuje smlouva a Yahoo nám za její poskytování platí.

CW: Dovolte mi nyní několik otázek o celém Internetu. Kam se Internet vyvíjí? Zůstane počítačovou sítí, změní se v televizi nebo se stane něčím novým, dnes těžko představitelným?

Monier: Myslím, že Internet je komunikačním médiem budoucnosti, že nahradí všechny ostatní sítě, nejen ty počítačové. Nebude důvod mít speciální televizní síť, telefonní síť atd. Všude je dnes cítit tlak na zvětšení šířky pásma na Internetu. Masové rozšíření Internetu je jen otázkou času, o tom dnes již není pochyb.

CW: Co znamená Internet pro vás osobně? Máte čas si s ním hrát?

Monier: Rád bych měl mnohem více času na hraní s Internetem. Je to nové komunikační médium a zacházím s ním podle toho. Dnes představuje jen moji práci.

CW: Jak dlouho pracujete u firmy Digital?

Monier: Jsem u firmy od roku 1989. Před AltaVistou jsem navrhoval VLSI čipy a CAD nástroje. Před nástupem k Digitalu jsem pracoval u Xeroxu.

CW: Máte rodinu? Kolik času vám na ni zbývá a jak to snáší?

Monier: Jsem ženatý, děti nemám. Moje žena Evelyne je velmi trpělivá. Přesto není jednoduché mít nějaký čas na rodinný život, když je člověk technickým vedoucím takového projektu.

CW: Děkuji za rozhovor.


| <<< | CW o Internetu | COMPUTERWORLD | IDG CZ homepage |