Darmowa prenumerata - tu i teraz!
BezImienny - wersja online!
Najlepsze, polskie programy FREEWARE
Poprzedni artykułNastępny artykuł Komputery  

Rozmowa z komputerem


Grzegorz Gałęzowski

Od wielu dziesięcioleci w książkach i filmach science fiction bardzo często opisywany jest świat, w którym ludzie porozumiewają się z maszynami, po prostu mówiąc do nich. Wynika to z tego, że bardzo byśmy chcieli, by komputery zachowywały się podobnie jak my.

Przyszłość komunikacji człowiek - komputer należy zapewne do interfejsu głosowego, niestety dotychczasowe systemy takich firm jak Nuance, Philips, SpeechWorks itd. można było wykorzystać tylko do prostych zadań, np. do uzyskania wiadomości, informacji z giełdy czy wysłuchania przez telefon listów wysłanych pocztą elektroniczną.

Opracowany przez MIT (Massachusetts Institute of Technology) Laboratory for Computer Science zaawansowany interfejs głosowy umożliwia wydawanie poleceń komputerom i zdobywanie tą drogą informacji bez kiwnięcia palcem. Takim właśnie systemem jest architektura Galaxy, oparta na rozpoznawaniu mowy i jej syntezie. Architektura ta zaczęła funkcjonować w 1994 roku.

Galaxy potrafi zdobywać informacje z kilku różnych dziedzin i przekazywać je użytkownikowi. System może prowadzić dialog z wieloma osobami równocześnie. Z usług Galaxy korzystać można głównie przez telefon, ale także można polecić przesłanie danych do komputera.

Galaxy pełni pięć podstawowych funkcji: rozpoznaje mowę, rozumie teksty, zdobywa informacje, tworzy teksty i dokonuje syntezy mowy. Gdy zadamy pytanie, serwer o nazwie Summit porównuje wypowiedziane słowa z fonemami (najmniejsze jednostki języka mówionego, które różnicują znaczenie słów), które ma w bazie danych. Summit sporządza później uporządkowaną listę zdań, które mogły być wypowiedziane. Lista powstaje na podstawie interpretacji naszej wypowiedzi przez maszynę. Następnie, by najbardziej pasujące zdanie zostało odpowiednio zinterpretowane, inny serwer systemu Galaxy, o nazwie Tina, dokonuje jego rozbioru. Stosując podstawowe reguły gramatyczne, Tina wyodrębnia podmiot, orzeczenie, dopełnienie itd. Teraz musi tak sformułować zdanie, by było ono zrozumiałe dla systemu. Trzeci serwer, zwany Genesis, tak formatuje komendę, by można było znaleźć informacje w odpowiedniej bazie danych. Na podstawie analizy pytania użytkownika system wie, gdzie powinien szukać odpowiedzi. Gdy już zdobędzie informacje, Tina znowu przetworzy je na komendy. Następnie Genesis uczyni z komend zdanie zrozumiałe dla użytkownika. Wreszcie profesjonalny syntezator mowy pracujący na jeszcze innym serwerze wypowiada to zdanie.

Dotychczas przystosowano kilka aplikacji do współpracy z systemem Galaxy, z których da się korzystać za pomocą telefonu. Jupiter informuje o pogodzie w 500 miastach na całym świecie. Pegasus udziela informacji o kursach 4000 samolotów latających w USA. Dane są aktualizowane co dwie lub trzy minuty. Voyager informuje o ruchu miejskim i przejazdach ulicami aglomeracji bostońskiej. Po to, by przejść z jednej aplikacji do drugiej, wystarczy po prostu powiedzieć: "Chcę rozmawiać z Jupiterem", czy też "Połącz mnie z Voyagerem" (oczywiście tylko po angielsku). Od maja 1997 roku Jupiter przeprowadził już ponad 30 tys. Rozmów. Około 80% dialogów z klientami, którzy dzwonili po raz pierwszy, zostało poprawnie zinterpretowanych. Rozmowy są nagrywane i oceniane w celu polepszenia jakości usług świadczonych przez system.


Rozmowa z Jupiterem.

Oto zapis rozmowy telefonicznej przeprowadzonej z systemem Jupiter. Do systemu tego można dzwonić w USA pod bezpłatnym numerem:1-888-573-8255.

[dzwonek telefonu]

Jupiter: Dzień dobry. Połączyłeś się z Jupiterem, informatorem pogodowym opracowanym przez MIT Lab for Computer Science. Rozmowa ta jest nagrywana w celu polepszenia w przyszłości jakości usług systemu. W każdej chwili możesz się rozłączyć lub poprosić o pomoc. Czym mogę służyć?

Człowiek: Jaka pogoda będzie dzisiaj w Bostonie?

Przez 7 s słychać melodię z programu telewizyjnego Jeopardy (Niebezpieczeństwo). Po każdym kolejnym pytaniu następuje 1-3 sekundowa pauza.

Jupiter: Dzisiaj po południu w Bostonie zachmurzenie umiarkowane. Wietrznie. Temperatura maksymalna około 10 stopni. W nocy zachmurzenie małe, temperatura minimalna około 2 stopni. Czy chcesz dalszych informacji?

Człowiek: Czy będzie jutro padać?

Jupiter: O ile wiem, synoptycy jutro nie przewidują deszczu w Bostonie. Co jeszcze?

Człowiek: A w Seattle?

Jupiter: O ile wiem, synoptycy jutro nie przewidują deszczu w Seattle. Czy jeszcze coś chciałbyś wiedzieć?

Człowiek: Czy gdzieś w rejonie Morza Karaibskiego jest słonecznie?

Jupiter: Przepraszam, możliwe, że pytasz o miasto, którego nie znam. Spróbuj zapytać o stan lub państwo. Na przykład jakie znasz miasta w Massachusetts?

Człowiek: Jaka jest temperatura w Montego Bay?

Jupiter: Dzisiaj w Montego Bay temperatura maksymalna wynosi 30 stopni, minimalna -23 stopnie. Co jeszcze?

Człowiek: Do widzenia.


Wszystkich zainteresowanych tematem, odsyłam do strony http://www.neuron.of.pl gdzie znajdziecie linki do stron, na których zainstalowane są boty z którymi można sobie porozmawiać na chacie (posiadają różne "osobowości", np. Jezusa czy Presleya itd.). Można też zajrzeć na stronę www.yoyo.pl (chatterbot.yoyo.pl) na której zamieszczony jest bot Ana z którą można porozmawiać w naszym ojczystym języku.


Grzegorz Gałęzowski
poczta: gsgalezowski@poczta.onet.pl