E nter.net  


Wyszukiwanie informacji
Kamil D▒bkowski


D ostΩpno╢µ informacji w Internecie stanowi dla nas du┐e dobrodziejstwo. Korzystaj▒c z naszego PC i nie wychodz▒c z domu lub z biura, mo┐emy dowiedzieµ siΩ praktycznie wszystkiego na ka┐dy temat (abstrahuj▒c w tej chwili od jako╢ci tej informacji). Wystarczy, ┐e pod│▒czymy siΩ do sieci, a w naszej przegl▒darce WWW wpiszemy adres jakiego╢ serwisu informacyjnego, za╢ w miejscu do tego przeznaczonym umie╢cimy zagadnienie (jedno s│owo lub ca│▒ frazΩ), kt≤re nas interesuje i wci╢niemy magiczny klawisz Search.

Problemy zaczynaj▒ siΩ w chwili, gdy w wyniku naszego wyszukiwania otrzymali╢my 7653 adresy lub gdy nie otrzymali╢my nic. W pierwszym z tych przypadk≤w pocz▒tkuj▒cy u┐ytkownik Internetu zapewne siΩ ucieszy i zacznie po kolei zagl▒daµ pod ka┐dy adres - w rezultacie prawdopodobnie nie znajdzie ┐adnej lub prawie ┐adnej interesuj▒cej go informacji. W drugim przypadku do zniechΩcenia dochodzi jednak szybciej.

Zadajemy wiΩc sobie pytanie: Co powoduje, ┐e wyniki wyszukiwania przez internetowy serwis wyszukiwawczy tak dalece nas nie zadowalaj▒? Prawdopodobnie przyczyn▒ frustracji u tych os≤b, kt≤rym co╢ takiego siΩ przydarzy│o, by│o ╝le zadane pytanie. Zdecydowana wiΩkszo╢µ ludzi profesjonalnie zajmuj▒cych siΩ wyszukiwaniem informacji w du┐ych systemach informacyjnych (np. DIALOG) twierdzi, ┐e podstaw▒ dobrego wyszukiwania jest uzgodnienie z klientem, czego on w│a╢ciwie oczekuje, co chce znale╝µ, jak du┐o dokument≤w na okre╢lony temat bΩdzie go satysfakcjonowa│o i ile chce (lub mo┐e) za tΩ us│ugΩ zap│aciµ. Podobne pytania musimy r≤wnie┐ i my sobie zadawaµ. Kiedy ju┐ bΩdziemy wiedzieµ, czego chcemy, to czas zastanowiµ siΩ, jak skonstruowaµ zapytanie do serwisu informacyjnego, aby otrzymaµ dokumenty relewantne.

AltaVista


AltaVista
Adres AltaVista - www.altavista.digital.com
W przypadku serwisu AltaVista (www.altavista.digital.com), musimy siΩ zdecydowaµ, czy bΩdziemy korzystaµ z wyszukiwania prostego - Simple search, gdzie szybko i │atwo mo┐na znale╝µ potrzebne informacje, czy te┐ z wyszukiwania zaawansowanego Advanced search, je┐eli interesuje nas odnalezienie dokument≤w z u┐yciem operator≤w booleanowskich i innych funkcji rozszerzaj▒cych wyszukiwanie. Korzystaj▒c z wyszukiwania prostego, mo┐emy pos│ugiwaµ siΩ czterema rodzajami operator≤w. Je┐eli chcemy, aby jakie╢ s│owo znalaz│o siΩ w naszym wyszukiwaniu, musimy przed nim postawiµ znak "+", np.: beatles +lennon. Natomiast je┐eli nie chcemy braµ pod uwagΩ w naszym wyszukiwaniu danego zagadnienia, musimy je poprzedziµ znakiem "-", np.: daewoo -car. Trzeci spos≤b polega na zamkniΩciu naszej frazy wyszukiwawczej w cudzys│owie. W≤wczas AltaVista bΩdzie szukaµ tylko tych dokument≤w, w kt≤rych wystΩpuje wy│▒cznie ca│a fraza, a nie jej poszczeg≤lne wyra┐enia, np. "virtual reality modelling language". Czwarty spos≤b wyszukiwania wykorzystujemy wtedy, gdy znamy tylko czΩ╢µ s│owa, o kt≤rego znaczeniu chcemy siΩ czego╢ dowiedzieµ, b▒d╝ wtedy, gdy chcemy wyszukaµ informacje na temat wszelkich mo┐liwych odmian danego wyra┐enia. Wtedy musimy po naszym zapytaniu umie╢ciµ dobrze nam sk▒din▒d znany znak "*", np. light*.
Mo┐emy r≤wnie┐ zadecydowaµ, czy wyszukujemy w╢r≤d adres≤w WWW, czy te┐ szukamy grupy usenetu i w jakim jΩzyku maj▒ byµ zredagowane strony, kt≤re otrzymamy w odpowiedzi na kwerendΩ. AltaVista daje r≤wnie┐ mo┐liwo╢µ wyszukiwania z opcj▒ case-sensitive, tzn. z uwzglΩdnieniem w zapytaniu du┐ych i ma│ych liter. Je┐eli chcemy, aby tak siΩ sta│o, u┐ywamy du┐ych liter w odpowiednich miejscach, je┐eli nie, to ca│e zapytanie piszemy ma│ymi literami. AltaVista ma r≤wnie┐ bardzo pomocne narzΩdzie zwane Cow9, kt≤re umo┐liwia wykorzystanie dotychczasowych trafie± i zawΩ┐a wyszukiwania tylko do nich. Ponadto AltaVista pozwala na wyszukiwanie nie tylko konkretnego tekstu, ale r≤wnie┐ rysunk≤w, adres≤w URL czy aplet≤w Javy.
Wszystkie przedstawione funkcje dotycz▒ r≤wnie┐ Advanced search. W wyszukiwaniu zaawansowanym musimy uwa┐aµ, aby dobrze okre╢liµ klasΩ (ranking) zagadnie± (w wyszukiwaniu prostym klasΩ kontrolowa│a za nas wyszukiwarka). Je┐eli nie okre╢limy ┐adnej klasy, wtedy otrzymane dokumenty u│o┐one bΩd▒ bez okre╢lonego porz▒dku. ListΩ operator≤w booleanowskich wykorzystywanych w wyszukiwarce AltaVista (operatory + i - w wyszukiwaniu zaawansowanym nie dzia│aj▒) zawiera ramka. Je┐eli chcemy wyszukiwaµ z ograniczeniem czasowym daty pocz▒tku i ko±ca lub tylko pocz▒tku, wpisujemy w formacie dzie±/miesi▒c/rok - jednak nale┐y pamiΩtaµ, aby miesi▒c wpisywaµ s│ownie, skr≤tami, np. "jan" - stycze±.
Z│o┐one kwerendy mo┐emy tworzyµ, wykorzystuj▒c nawiasy okr▒g│e i grupuj▒c w nich osobne zagadnienia (zupe│nie jak w matematyce), np. poland AND ("computer magazine" AND NOT enter).

Polski Infoseek


Polski Infoseek
Adres Infoseek - Infoseek.icm.edu.pl
Infoseek (infoseek.icm.edu.pl) jest jedn▒ z najszybszych wyszukiwarek internetowych. Nawet przy bardziej skomplikowanych zapytaniach nie musimy d│ugo czekaµ, a to dziΩki wykorzystaniu przez Infoseek nowoczesnego narzΩdzia, jakim jest Ultraseek, ponoµ sto razy szybszy ni┐ narzΩdzia AltaVisty czy Lycosa. Aby jednak m≤c korzystaµ ze wszystkich dobrodziejstw oferowanych przez Infoseek, musimy zapoznaµ siΩ z zasadami, jakimi nale┐y siΩ kierowaµ przy tworzeniu zapyta±.
Generalnie nale┐y pamiΩtaµ o czterech zasadach (kt≤re zreszt▒ nie odnosz▒ siΩ tylko do Infoseek). Po pierwsze, u┐ycie wiΩkszej liczby s│≤w w zapytaniu da nam bardziej szczeg≤│owe wyniki. Po drugie, je╢li chcemy, aby frazy wystΩpowa│y razem, umieszczamy je w cudzys│owach. Po trzecie, u┐ycie du┐ych liter zgodnie z zasadami gramatyki zwiΩksza trafno╢µ. Po czwarte, je┐eli chcemy wyszukiwaµ za pomoc▒ kilku osobnych zwrot≤w, nale┐y je oddzieliµ przecinkami.
Infoseek daje mo┐liwo╢µ wyszukiwania wed│ug zawarto╢ci p≤l META w dokumentach HTML. Znaczniki META znajduj▒ siΩ w g│≤wce strony (od <HEAD> do </HEAD>) i zawieraj▒ r≤┐ne informacje o stronie, np. autor, tryb kodowania dokumentu itd. W polu META mo┐emy r≤wnie┐ u┐yµ standardowych p≤l description (opis) i keywords (s│owa kluczowe), wed│ug kt≤rych mo┐e siΩ potem odbywaµ wyszukiwanie danej strony.
Gdy strona z zawarto╢ci▒ znacznika META dostanie siΩ do indeksu Infoseek - zawarto╢ci p≤l content zostan▒ poindeksowane tak, aby potem mog│y byµ brane pod uwagΩ przy wyszukiwaniu. Ponadto je┐eli dana strona zostanie wyszukana, to przy adresie uka┐e siΩ opis pochodz▒cy z pola description. Infoseek podobnie jak AltaVista ma kilka funkcji specjalnych (opisanych wy┐ej): link:, url:, title:, site:.
Obie wyszukiwarki s▒ godnymi partnerami przy wyszukiwaniu informacji. Pomimo tego, ┐e AltaVista ma trochΩ wiΩcej mo┐liwo╢ci wyszukiwawczych (ograniczenie dat▒, podzia│ na wyszukiwanie proste i z│o┐one, wyszukiwanie przybli┐one), to Infoseek nie ustΩpuje jej, zw│aszcza pod wzglΩdem relewancji otrzymanych dokument≤w. Du┐▒ zalet▒ obu wyszukiwarek jest r≤wnie┐ to, ┐e pozwalaj▒ na dowolne │▒czenie r≤┐nych metod wyszukiwawczych praktycznie bez ogranicze±.

U┐yteczne funkcje AltaVisty


  • anchor:"tekst" - wyszukuje strony z odsy│aczami, kt≤re zawieraj▒ podany przez nas tekst, np. anchor:"Czarna Dziura";
  • applet:class - wyszukuje aplety Javy, np. applet:ball;
  • domain:nazwa_domeny - wyszukuje strony z podan▒ domen▒, np. domain:com;
  • host:nazwa_komputera - znajduje strony na wyznaczonym komputerze, np. host:enter.pol.pl;
  • image:nazwa_pliku - wyszukuje pliki graficzne o podanej nazwie;
  • link:adres_URL - wyszukuje wszystkie strony pod│▒czone do adresu, kt≤ry podamy;
  • text:tekst - znajduje strony, kt≤re zawieraj▒ podany tekst, pomijaj▒c tagi HTML, linki i adresy URL;
  • title:tekst - znajduje strony, kt≤re podany tekst maj▒ w tytule (pokazuj▒cym siΩ na g≤rnym pasku przegl▒darki);
  • url:tekst - znajduje wszystkie adresy URL, kt≤re w nazwie maj▒ podany tekst.

Funkcje specjalnych dla grup usenetu


  • from:nazwa_u┐ytkownika@adres - wyszukuje artyku│y opublikowane przez kogo╢ o okre╢lonym adresie;
  • subject:"tekst" - wyszukuje artyku│y zawieraj▒ce okre╢lony fragment tekstu;
  • newsgroup:nazwa_grupy - wyszukuje artyku│y okre╢lonej newsgroup. Mo┐na u┐ywaµ tylko fragment≤w nazw grup, np. newsgroup:pl, aby wyszukaµ wszystkie polskie grupy newsgroup;
  • summary:tekst - znajduje artyku│y z okre╢lonym tekstem w polu spisu tre╢ci;
  • keyword:tekst - znajduje artyku│y z okre╢lonym tekstem w polu s│≤w kluczowych.

Operatory booleanowskie AltaVisty


  • AND lub & - znajduje dokumenty zawieraj▒ce s│owa lub frazy po│▒czone tym operatorem.
  • OR lub | - znajduje dokumenty zawieraj▒ce przynajmniej jedno z podanych s│≤w lub fraz.
  • NOT lub ! - znajduje dokumenty nie zawieraj▒ce podanego wyra┐enia. Operator NOT nie mo┐e wystΩpowaµ osobno, musi byµ po│▒czony z operatorem AND lub OR, np. enter AND NOT keyboard.
  • NEAR lub ~ - wyszukuje dokumenty zawieraj▒ce przynajmniej 10 s│≤w, w kt≤rych znajduj▒ siΩ fragmenty s│≤w podanych.

(c) Copyright LUPUS