Statystyka

Statistica 5.1 PL
Nareszcie po polsku
CHIP CD 4/97
Romuald Gnitecki
   
Statistica należy do ścisłej światowej czołówki pakietów do statystycznej analizy danych. Program zdobył sobie uznanie użytkowników szybkością działania, bogactwem opcji i znakomitymi możliwościami w zakresie graficznej wizualizacji danych i wyników obliczeń. Niedawno na rynku pojawiła się zlokalizowana wersja aplikacji (opis wersji 5.0 ukazał się w numerze 11/95).

     Co roku tysiące studentów różnych uczelni i kierunków męczy się przy obliczaniu różnych dziwnych wielkości - median, korelacji, wariancji, testowaniu hipotez i innych, równie skomplikowanych zadań. Mało kto zdaje sobie sprawę, że prawdziwa statystyka jest nauką znacznie trudniejszą, ale przy tym niezmiernie pożyteczną i piękną (nie podzielamy tego ostatniego poglądu - przyp. red.). Ma ona zastosowanie w przeróżnych dziedzinach, a jej podstawy powinien znać każdy menedżer, inżynier, naukowiec, słowem: wszyscy ci, którzy w swej pracy spotykają się z koniecznością analizowania dużej liczby danych.

     Statystyka jest nauką zajmującą się opisem danych i wnioskowaniem w warunkach niepewności. Decyzje nie mogą być jednak podejmowane na podstawie zwykłej średniej arytmetycznej, lecz wymagają użycia znacznie poważniejszych procedur. Pomocą służą odpowiednie narzędzia, wśród nich Statistica.


Pakiet Statistica jest znany z bogatych możliwości graficznej prezentacji wyników

     Produkt StatSoftu zawiera bardzo obszerny zestaw zaawansowanych procedur do obróbki danych statystycznych. Ze względu na liczbę dostępnych opcji zostały one pogrupowane w szereg modułów wywoływanych za pomocą małego programu ładującego. Każdy moduł zawiera grupę funkcji z określonej dziedziny statystyki. Lista tych funkcji jest bardzo długa; w jej skład wchodzą m.in. statystyki opisowe, testy nieparametryczne, ANOVA, MANOVA, regresja wielokrotna z prognozowaniem, estymacja nieliniowa, modelowanie i prognozowanie szeregów czasowych, analiza skupień, analiza kanoniczna, modelowanie równań strukturalnych, symulacja Monte Carlo, analiza rzetelności z opcją "co jeśli", analiza funkcji dyskryminacyjnej, analiza logliniowa, techniki analizy przeżycia z testami i dopasowaniem rozkładu, moduł wspomagający sterowanie jakością w procesach produkcyjnych i planowanie doświadczeń w przemyśle.


Każdy moduł programu ma własne menu z wieloma opcjami

     Pakiet potrafi przetwarzać bardzo duże ilości danych. Specjalne narzędzie do zarządzania wielkimi plikami danych, Megafile Manager, akceptuje do 32 000 zmiennych (pól; 8 MB) w rekordzie, macierz korelacji może mieć rozmiar 32 000 na 32 000, schematy analizy wariancji nie są ograniczone. Liczby rzeczywiste zapisywane są w poczwórnej precyzji. Dane mogą być eksportowane do (i importowane z) formatów Excela, Lotusa 1-2-3, Quattro Pro, dBASE'a, Paradoxa, ASCII, a nawet konkurencyjnego SPSS.

     Aplikacja posiada wbudowany język programowania STATISTICA BASIC, umożliwiający m.in. wykonywanie operacji na macierzach, obsługę grafiki i łączenie z programami zewnętrznymi za pośrednictwem bibliotek dynamicznych (DLL). Dzięki drugiemu językowi - SCL (Statistica Command Language) - program może dodatkowo działać w trybie wsadowym (batch). Użytkownik ma tutaj możliwość definiowania sekwencji poleceń, a następnie ich uruchamiania dla zadanych zmiennych. Tworzenie plików wsadowych ułatwiają kreatory oraz narzędzia weryfikujące formalną poprawność poleceń i ich zgodność z zawartością zbiorów danych.

     Silną stroną aplikacji są możliwości w zakresie generowania wykresów. Statistica potrafi zdefiniować taką grafikę do prezentacji danych i wyników, o jakiej nawet najwięksi potentaci na rynku aplikacji biurowych i numerycznych mogą niekiedy jedynie pomarzyć. Dziesiątki dostępnych dwu- i trój-, a nawet wielowymiarowych (np. 4D) rodzajów wykresów można w dowolny sposób modyfikować, ponadto użytkownik ma możliwość definiowania własnych sposobów graficznej prezentacji wyników. Dodatkowo pakiet udostępnia narzędzia do animacji, dopasowywania, wygładzania i nakładania krzywych, tworzenia powierzchni spektralnych i warstwic.


Wykres warstwicowy jest ciekawym i przydatnym sposobem wizualizacji wyników

     Pomysł spolszczenia pakietu zasługuje na pochwałę. Należy docenić ogromny nakład pracy poniesionej na tłumaczenie obszernego modułu Pomocy. Polskie opisy funkcji i zagadnień statystycznych powodują, że rozwiązywanie problemów - dobór metod, interpretacja wyników oraz ich graficzna prezentacja - staje się o wiele łatwiejsze niż w przypadku pakietów angielskojęzycznych. Trzeba jednak wrzucić kamyczek do ogródka polskiego oddziału StatSoftu, gdyż w trakcie polonizacji popełniono błędy, które nie występują w wersji angielskiej. Nie działa pozycja menu Pomoc|Wykresy, w menu Edycja zamiast pozycji Zmienne wpisano "Drukuj pliki", w analizie skupień program wykonuje co prawda obliczenia związane z grupowaniem drzewkowym, lecz potrafi zawiesić się przy tworzeniu wykresu nawet dla danych przykładowych dostarczanych przez producenta. Kliknięcie w Pomocy odsyłacza "Więcej informacji" powoduje tylko wyświetlenie okienka zawierającego jedynie napis "Więcej informacji", tyle, że większą czcionką. W module taksonomii przy podziale na grupy program nie podaje numerów wierszy, z których pochodzą pogrupowane elementy, co utrudnia ich identyfikację. Niektóre komunikaty programu nie są wyświetlane w całości - brak zakończenia nie pozwala zrozumieć treści wiadomości. Domyślne czcionki dla wyników obliczeń nie są ustawione na środkowoeuropejskie i wymagają ręcznej konfiguracji. W większości przypadków opisane usterki nie przeszkadzają w pracy; dystrybutor obiecał ponadto ich szybkie usunięcie i bezpłatne uaktualnienie dla zarejestrowanych użytkowników.


Jedną z niedogodności polskiej edycji pakietu Statistica są niepełne komentarze i utrudniające odczyt wyników nie ponumerowane przypadki w tabeli rezultatów

     Omawiana aplikacja jest silnym narzędziem, mającym wielkie możliwości, działającym szybko i efektownie. Żal jedynie, że polonizacja stała się źródłem kilku błędów, nie występujących w angielskojęzycznej wersji pakietu. Na pocieszenie należy dodać, że StatSoft Polska właśnie przygotowuje do sprzedaży zmodyfikowane wydanie programu. Ma ono zawierać nową wersję modułu statystyki przemysłowej o nazwie SIS, (Statistica Industrial System).

     
Statistica 5.1 PL    
Wymagania: PC 386, 4 MB RAM (Windows 3.1x); PC 486, 8 lub 12 MB RAM (Windows 95 lub NT); napęd CD-ROM; ok. 34 MB na dysku
Producent: StatSoft, USA, http://www.statsoft.com/
Dostarczył: StatSoft Polska, Kraków, tel.: (0-601) 41 41 51,
fax: (0-12) 22 51 00 w. 227, e-mail: statsoft@bci.krakow.pl, http://www.statsoft.com/polish/
Cena: ok. 3940 zł
 
+ bogaty zestaw procedur statystycznych
+ względna łatwość obsługi
- bardzo dobra grafika
- błędy powstałe w trakcie lokalizacji