ReÜerÜnφ systΘm Tornßdo
Stanislav Psohlavec, AiP Beroun s.r.o., Beroun
SystΘm pro publikovßnφ velk²ch objem∙ dat. Ukßzky aplikace na bibliografick²ch bßzφch dat, patentovΘm t°φd∞nφ. Mo₧nosti automatizovanΘ aktualizace. Nßvaznost na systΘm AiP*Safe.

TORN┴DO
novß generace vyhledßvacφch nßstroj∙
od firmy Albertina icome Praha s.r.o.

Hlavnφ vlastnosti:

Modularita a flexibilita, snadnß instalace a aktualizace, kombinace zdroj∙, automatizovanß indexace

Prost°edφ:

Struktura, jazyky, hypertext, prßce s obrazem, Internet

Vyhledßvßnφ:

Zadßnφ dotazu, indexy

Mo₧nosti aplikace:

Publikace rozsßhl²ch dat, specializovanΘ bibliografickΘ databßze, alternativnφ p°φstup k é₧iv²mæ databßzφm

Pravd∞podobn∞ Vßs napadlo, proΦ v dob∞ globalizace, jednotφcφch se SW prost°edk∙ a Internetu soukromß firma vydßvß prost°edky na v²voj vyhledßvacφch nßstroj∙. Samoz°ejm∞ jsme porovnßvali efektivitu, v²kon, hardwarovΘ po₧adavky, cenu jin²ch koupiteln²ch nßstroj∙ i nßklady na v²voj chyb∞jφcφch komponent.

V²sledkem je, ₧e Vßm p°edstavujeme systΘm Tornßdo p°ichßzejφcφ po WiniFret. (Genezi p∙vodn∞ pouze pracovnφho nßzvu hledejte, prosφm, ve filmu éLimonßdov² Joeæ, nikoli v katastrofßch dvacßtΘho stoletφ).

Nabφzφme Vßm vÜak nikoli pouze systΘm. Vyu₧itφ tohoto systΘmu m∙₧e b²t souΦßstφ komplexnφ slu₧by û zp°φstupn∞nφ VaÜich dat. VaÜe data m∙₧eme zpracovat nap°φklad a₧ do formy publikovatelnΘ na Internetu nebo m∙₧eme kompletn∞ zajistit jejich klasickΘ vydßnφ na CD-ROM discφch.

Hlavnφ vlastnosti

SystΘm Tornßdo je urΦen ji₧ v²hradn∞ pro 32-bitovΘ prost°edφ, (W95..NT,2000). Kombinuje v²hody fulltextovΘ a strukturovanΘ databßze. Principieln∞ nep°ekonatelnß je vynikajφcφ rychlost vyhledßvßnφ, kterß je prakticky nezßvislß na mno₧stvφ dat. Tato rychlost je vykoupena nßroΦnou indexacφ.Tornßdo je proto mimo°ßdn∞ vhodn² systΘm pro publikovßnφ rozsßhl²ch dat na CD-ROM a DVD. Klade velmi nφzkΘ nßroky na v²kon poΦφtaΦe. Dovoluje i na mßlo v²konn²ch poΦφtaΦφch dosßhnout vynikajφcφ rychlosti vyhledßvßnφ.

SystΘm je ryze Φesk², bez dalÜφho licenΦnφho zatφ₧enφ.

Modularita a flexibilita

SystΘm Tornßdo je koncipovßn jako stavebnice modul∙ a proto dovoluje vytvß°et prost°edφ pln∞ p°izp∙sobenΘ zßkaznφkovi a typu dat. Je mo₧nß i implementace hotov²ch modul∙ zßkaznφka, nap°φklad pro k≤dovßnφ dat, tvaroslovφ ΦeÜtiny.

Instalace

Oproti p°edchozφ verzi (WiniFret) je radikßln∞ zjednoduÜena instalace. Dokonce lze vyu₧φt i mo₧nosti pracovat zcela bez instalace se zachovßnφm plnΘho v²konu. Lze vytvo°it aplikaci spouÜt∞nou v²hradn∞ z media - bez zßsahu na pevn² disk u₧ivatele. Ukßzkou m∙₧e b²t nap°. Mezinßrodnφ patentovΘ t°φd∞nφ a Mezinßrodnφ desetinnΘ t°φd∞nφ.

Aktualizace

Spojenφ dat na CD-ROM nebo DVD s jejich aktualizacφ je velice snadnΘ. Aktualizace je toti₧ tvo°ena jedin²m souborem. StaΦφ nap°φklad stßhnout tento souboru na Internetu a sd∞lit systΘmu, kde tento soubor le₧φ a tφm je aktualizace provedena. Aktualizaci lze i sv∞°it programu, m∙₧e sßm pravideln∞ testovat, zda aktualizace existuje a sßm si ji stßhnout. Aktualizace znamenß , ₧e dojde ke splynutφ p∙vodnφho zdroje dat s balφΦkem nov²ch, vΦetn∞ prolnutφ index∙. Je mo₧nß nejen p°φr∙stkovΘ aktualizace, ale i nahrazovßnφ neplatn²ch dat na pevnΘm mediu û nap° na CD-ROM.

Lze integrovat mo₧nost pracovat s vφce aktualizacemi tΘ₧e databßze souΦasn∞. Jednotlivß aktualizace pak m∙₧e p°edstavovat kvantum dat, kterΘ je zpracovatelnΘ dle pot°eby ka₧dou hodinu nebo i ka₧dou sekundu. Tφm systΘm m∙₧e zp°φstup≥ovat aktußlnφ data.

Aktualizace p°esto stßle tvo°φ samostatn² é°ezæ z celΘ databßze. U₧ivatel si m∙₧e volit, s kter²mi °ezy chce pracovat.

Kombinace vφce zdroj∙ dat

Stejn² princip jako pro aktualizace lze vyu₧φt k spoleΦnΘmu zp°φstupn∞nφ vφce tΘmaticky p°φbuzn²ch databßzφ, kterΘ ani nemusφ b²t shodnΘ struktury a p°esto na n∞ lze pohlφ₧et jako na jednotlivΘ é°ezyæ tΘ₧e databßze. Pak lze v jednom prost°edφ, ve spoleΦn²ch indexech a jedin²m dotazem vyhledat informace v p°φbuzn²ch zdrojφch.

Automatizovanß indexace

Podobn∞ jako d°φve u systΘmu WiniFret, i u Tornßda poΦφtßme s mo₧nostφ automatizovanΘho zpracovßnφ dat.

SystΘm tak dovolφ u zßkaznφka nainstalovat prost°edky, kterΘ samostatn∞ zpracujφ urΦenß data, a nap°φklad umo₧nφ jejich vystavenφ na Internetu.

Prost°e

je sestavitelnΘ dle po₧adavk∙ zadavatele prakticky bez omezenφ.

Vysokß je variabilita zobrazenφ - data se mohou prezentovat v nejr∙zn∞jÜφch formßch, p°ipraven²ch podle zadßnφ zßkaznφka, kter² si ale m∙₧e tuto formu i sßm vytvo°it nebo modifikavat. TotΘ₧ platφ i o exportu a tisku.

Je mo₧no vytvo°it vφce Üablon, do nich₧ jsou data éusazenaæ a nabφdnout u₧ivateli jejich volbu p°epφnßnφm.

U₧ivatel mß k dispozici t°i pohledy na databßzi û kompletnφ data, vyhledanΘ zßznamy a oznaΦenΘ zßznamy. HromadnΘ exporty a tisky jsou spojitelnΘ s t∞mito volbami. Je k dispozici i tzv. rychl² export jednotliv²ch zßznam∙ do p°edp°ipravenΘho souboru. Forma hromadnΘho i individußlnφho exportu a tisku je nezßvisle nastavitelnß na stylu aktußlnφho zobrazenφ.

V systΘmu mohou b²t prezentovßna i multimedißlnφ data nebo data, vyu₧φvajφcφ hypertext.

Struktura

Struktura databßze nenφ principieln∞ omezena, m∙₧e ji tvo°it neomezenΘ mno₧stvφ zßznam∙ Φlen∞nΘ do libovolnΘho mno₧stvφ polo₧ek. Ani velikost jednotlivΘho zßznamu ani polo₧ky nenφ omezena. Kvality systΘmu vyniknou p°edevÜφm na databßzφch obsahujφcφch extrΘmnφ mno₧stvφ zßznam∙.

Data mohou b²t ulo₧ena v jinΘ form∞ ne₧ jsou prezentovßna. Dobr²m p°φkladem je ╚eskß nßrodnφ bibliografie û zßkladnφ data u v∞tÜiny databßzφ jsou v  UNIMARCu, ale jejich prezentace je mo₧nß v Üesti jin²ch obvykl²ch formßtech.

Data mohou b²t dokonce zcela odd∞lena od index∙ û nap°. data na Internetu, vyhledßvacφ SW a indexy na lokßlnφm HD nebo na CD.

Jazyky

SystΘm je od poΦßtku koncipovßn jako mnohojazyΦn².

Zdrojovß data mohou b²t v libovoln²ch k≤dov²ch tabulkßch, lze pracovat souΦasn∞ s daty z celΘ Evropy i s azbukou.

Data v r∙zn²ch jazycφch se mohou vyskytovat souΦasn∞ ve spoleΦnΘm indexu.
Exporty mohou b²t v kterΘmkoli z vφce ne₧ Üedesßtφ k≤d∙ (kterΘ tvo°φ sbφrku ing. èibravy) p°φpadn∞ v GISMO konvenci.

Proto₧e mßme pln∞ pod kontrolou definici role jednotliv²ch znak∙ ve zpracovßvanΘm textu, p°ichßzφme v novΘm vydßnφ Mezinßrodnφho desetinnΘho t°φd∞nφ (MDT) s individußlnφ definicφ v²znamn²ch znak∙ tvo°φcφch éslovo MDTæ. To dovolilo indexovat a standardn∞ vyhledßvat notaci MDT (v²znamnΘ znaky tvo°φcφ éslovoæ jsou: =,(,',.,-,),/,`,0,1,2,3,4,5,6,7,8,9,A,Z).

Hypertext

Okno v n∞m₧ je zp°φstupn∞n v²sledek vyhledßnφ dovoluje za°azenφ jak²chkoli multimedißlnφch dat û obrazu, videa nebo zvuku. Dovoluje i za°azenφ hypertextov²ch odkaz∙. Typick²m p°φkladem je MDT nebo Mezinßrodnφ patentovΘ t°φd∞nφ. Tato data majφ typickou stromovou strukturu a pro heslo existujφ souvisejφcφ hesla vyÜÜφ i ni₧Üφ ·rovn∞. P°echod mezi t∞mito hesly umo₧≥ujφ hypertextovΘ skoky, stejn∞ jako odkazy na jinß voln∞ souvisejφcφ hesla. V podstat∞ se lze v tΘto struktu°e pohybovat jen s vyu₧itφm hypertextu. Komfortnφ vyhledßvßnφ vÜak nabφzφ mo₧nost najφt sprßvnß v²chozφ hesla a tφm podstatn∞ zefektiv≥uje prßci.

Prßce s obrazem

Okno v²sledku m∙₧e zobrazovat obsahovat i obrazovou informaci. Navφc je mo₧no zajistit kvalitnφ zobrazenφ obrazov²ch dat svßzan²ch se zßznamem v samostatnΘm okn∞. Zde jsou pak k dispozici i nßstroje pro ·pravu obrazu, navigßtor pro orientaci v rozsßhlejÜφch obrazech, mo₧nost ulo₧enφ vφce nastavenφ prohlφ₧eΦe.

Internet

Modularita systΘmu dovoluje zp°φstupn∞nφ databßzφ zpracovan²ch v Tornßdu na WWW strßnkßch.

Je mo₧no vyu₧φt vÜech mo₧nostφ vyhledßvßnφ, vyjma prßce s indexem.

Vyhledßvßnφ

Jak ji₧ bylo °eΦeno, vyhledßvßnφ je extrΘmn∞ rychlΘ. KonkrΘtnφ dotaz poskytne mno₧inu vÜech v²skyt∙ ihned, zcela nezßvisle na tom, zda databßze obsahuje 10, 10.000 nebo 10.000.000 zßznam∙. P°i zpracovßnφ dat - indexaci û se uchovßvß mnoho informacφ zrychlujφcφch vyhledßvßnφ. Tφm se podstatn∞ zjednoduÜuje a zrychluje prßce poΦφtaΦe p°i pozd∞jÜφm hledßnφ. To p°inßÜφ °ßdov∞ ni₧Üφ zatφ₧enφ poΦφtaΦe (p°φpadn∞ i sφt∞) p°i prßci se systΘmem Tornßdo ve srovnßnφ s jin²mi systΘmy. Proto lze dosahovat vynikajφcφ rychlosti vyhledßnφ i na mΘn∞ v²konn²ch poΦφtaΦφch.

Zadßvßnφ dotazu

Formulß° pro zadßnφ dotazu je bu∩ vytvo°en dle p°ßnφ zadavatele nebo lze pou₧φt standardnφ.

Slova lze zadßvat klasick²mi konvencemi s vyu₧itφm hv∞zdiΦky zprava i zleva a otaznφku (p°φkl*, p??klad, *tel). Pro otaznφk lze urΦit zda je pevnou nßhradou za znak nebo zda tento znak m∙₧e i chyb∞t. Lze vyhledßvat slova, skupiny slov, hesla, datumy a Φφsla. Datumy a Φφsla lze zadßvat i formou vyjad°ujφcφ urΦitΘ obdobφ, rozsah.

Pro vyjßd°enφ vztahu mezi operandy dotazu lze vyu₧φvat logickΘ i proximitnφ operßtory, vΦetn∞ éod..doæ.

Forma kladenφ dotazu je dosti volnß, je akceptovßno mnoho pravd∞podobn²ch forem zßpisu dotazu.

P°i vyhledßvßnφ sekvence dvou i vφce blφzko sebe le₧φcφch slov lze urΦit v²znamnost po°adφ v tΘto sekvenci i tolerovanou vzdßlenost.

Dotazy mohou na sebe navazovat, vyhledßvat lze v ji₧ vyhledanΘm, lze zde i p°idßvat nebo vyluΦovat.

Tvorbu dotazu velmi usnad≥ujφ  indexy vyskytujφcφch se dat.

Indexy

Indexy mohou b²t textovΘ, heslovΘ, datumovΘ a ΦφselnΘ a to i souΦasn∞ nad jednou polo₧kou.

Lze vytvß°et i spoleΦnΘ indexy nad vφce polo₧kami, kterΘ je nap°φklad z hlediska prezentace dat vhodnΘ rozd∞lit, ale

z hlediska vyhledßvßnφ mohou b²t spojenΘ. M∙₧e tedy existovat i globßlnφ index.

Indexy mohou b²t filtrovanΘ - p°i indexaci lze aplikovat slovnφky nezajφmav²ch slov nebo naopak indexovat jen v²znamnß slova. Z indexu mohou b²t vylouΦeny vybranΘ Φßsti zdrojov²ch dat.

Dotaz lze formulovat Φi kontrolovat s ·Φinnou pomocφ indexu. Otev°en² index reaguje na zßpis dotazu, je v n∞m zv²razn∞no, co ji₧ p°φpadn² dotaz vyhledß.

P°i psanφ dotazu s otev°en²m indexem lze napsat jen to, co skuteΦn∞ existuje nebo pou₧φt æ?Æ,Æ*Æ.

P°i ne·sp∞ÜnΘm pokusu o zßpis nabφdne slovnφk v₧dy nejbli₧Üφ alternativu.

Index lze p°epnout do re₧imu, kdy v indexu z∙stßvß jen v²b∞r slov odpovφdajφcφch p°ipravovanΘmu dotazu (æV²b∞rÆ). P°φkladn∞ zapφÜu-li v tomto re₧imu æA???Æ zbydou v indexu jen Φty°znakovß slova zaΦφnajφcφ na æAÆ.

Otev°enφ indexu nad ji₧ hotov²m dotazem dovoluje kontrolu, zda v²raz na kter² ukazoval kurzor existuje. V²raz se modifikuje podle mo₧nostφ existujφcφch v indexu û je umo₧n∞na snadnß kontrola a modifikace ne·sp∞ÜnΘho dotazu.

Mo₧nosti aplikace

Publikace rozsßhl²ch dat

SystΘm je vyu₧iteln² pro publikaci libovoln²ch zdroj∙ dat na pevn²ch mediφch. ZvlßÜt∞ v²hodn² je pro zp°φstupn∞nφ velk²ch objem∙ dat a kombinaci s jejich aktualizacemi, p°φpadn∞ i spoleΦnΘ prost°edφ pro vφce souvisejφcφch zdroj∙ dat.

SpecializovanΘ bibliografickΘ databßze

Je ji₧ dob°e propracovßna metodika indexace a konverzφ dat z UNIMARCu i z ISISu. Proto lze s nφzk²mi nßklady vydat data ulo₧enß touto formou. Vzorem nabφzen²ch mo₧nostφ je ╚eskß nßrodnφ bibliografie.

Alternativnφ p°φstup k velk²m é₧iv²mæ databßzφm

Rychlost a mo₧nosti vyhledßnφ, nφzkΘ nßroky na v²kon poΦφtaΦ∙ provßd∞jφcφch vyhledßnφ, mo₧nost automatizovanΘ produkce a distribuce databßze i jejφch aktualizacφàa v neposlednφ °ad∞ i nφzkß cena, to vÜe nabφzφ mo₧nost efektivnφho alternativnφho p°φstupu k rozsßhl²m ₧iv²m dat∙m, a to i éoff-lineæ.

NaÜe firma Vßm nabφzφ pomoc p°i hledßnφ optimßlnφho zp∙sobu zp°φstupn∞nφ VaÜich dat i kompletnφ slu₧by p°i realizaci VaÜich zßm∞r∙.

ing. Stanislav Psohlavec, AiP