home *** CD-ROM | disk | FTP | other *** search
/ The Datafile PD-CD 5 / DATAFILE_PDCD5.iso / utilities / a / analysis / !ANALYSIS / !HELP_IT < prev    next >
Text File  |  1994-12-16  |  9KB  |  42 lines

  1. !ANALYSIS, programma di Analisi testuale, di Giovanni Lo Conti, Via Bizzozero, 7 Roma,tel 0630311611- Interfaccia grafica di Raffaele Ferrigno Via Andrea d'Isernia, 16 Napoli*********************************************************
  2.  
  3.  
  4.    !ANALYSIS , v. 2.7 nov 1994 
  5.  
  6.  !Analysis e' un programma di analisi testuale, che, al pari di analoghi programmi esistenti per DOS, Macintosh e Unix, permette di sottoporre un testo a numerose indagini di tipo statistico.Alcune di esse (concordanze, indici di leggibilità,...), sono di uso piu' generale, altre (co-occorrenze,...)sono utilizzabili per un' analisi mirata del testo in esame. Scritto in  ICON, un linguaggio elaborato dal Department of Computer Science,the University of Arizona,Tucson AZ 85721 U.S.A., utilizza anche procedure gia' esistenti('concordanze','tablw',di Griswold,University of Arizona,procedura'KWIC'di Stephen B. Wampler, modificata da  Ralph E. Griswold, per un totale di trecentoventi linee, su un totale di circa duemila linee), opportunamente modificate.La proprietà del programma è riservata, e, nel caso di uso per lavori di ricerca, si prega di citare l' ICON Project,il programma e il sottoscritto.
  7.  
  8. Istruzioni 'provvisorie' per l' uso.
  9. Con !Analysis si possono analizzare testi in ASCII (sono ammesse e riconosciute le lettere accentate), anche molto lunghi, ma ,in questo caso, anche con ARM3 e 4 mb di RAM, il tempo si allunga anche notevolmente; anche  il file di OUTPUT, il cui nome può essere deciso dall' utente, è in formato ASCII; il confronto di un testo con un dizionario ( possibile sia con "Concordanze", che con "KWIC", permette di acquisire informazioni molto utili, da integrare con gli indici di leggibilità e statistici; se viene usato un dizionario di base della lingua è possibile intervenire sul testo per migliorarne la leggibilità; anche in questo caso l' ampiezza del vocabolario è determinata dalla RAM disponibile,(le prove sono state effettuate con un  dizionario di circa 35.000 parole, 350kb) ma se l' analisi termina con un messaggio di errore ("inadequate space...) è possibile nella maggior parte dei casi  portare a termine l'analisi : occorre uscire dal DESKTOP (doppio click su EXIT), e digitare "&.!ANALYSIS.!CODE"; il nome del file che contiene il DIZIONARIO può essere indicato nella finestra o, alternativamente, può essere 'trascinata' la sua icona nel MENU' e verrà automaticamente caricato; è possibile anche indicare una lista di parole.  Il "Wimpslot" (la memoria riservata per l'applicazione è stato fissato in 1000k , ma esso può essere aumentato o diminuito secondo le esigenze, modificando con !EDIT  o con un editor qualsiasi il file !RUN;si tenga presente, però, che !ANALYSIS richiede parecchia memoria. Vengono utilizzati dei file temporanei, la cui allocazione, per default su RAM, può essere decisa dall'utilizzatore (Menu' "Inclusione..."), ma si consiglia l' uso della RAM; la sua dimensione (fissata in 100k, deve essere almeno il doppio del testo da analizzare. Avvertenze: e` necessario che in caso di uso dell' apostrofo ci sia uno spazio   che lo separi dalla parola successiva(non "l'a..." ma "l' a..."); alcuni tipi di analisi (co-occorrenze, Lemmatizzazione, Indici di leggibilità), dividono il testo in microtesti( frasi o periodi),perciò è necessario che il testo termini con un punto; i punti sospensivi(...)  sono trattati cone un solo separatore e, quindi, come fine periodo. E' conteggiata anche la punteggiatura "debole" all'interno del periodo (virgola, due punti, punto e virgola). Occorre fare attenzione alle abbreviazioni puntate (es., d.C., cfr.,ecc.,  vengono interpretati come finali di periodo), e trovare un modo alternativo di scriverle all'interno della frase,  per esteso. In alcuni casi le maiuscole del testo sono trasformate automaticamente in minuscole: ciò avviene con la ricerca mirata di occorrenze; chiaramente così si perdono anche le maiuscole dei nomi propri; ricordarsi di ciò nell' analisi dei risultati; si tenga anche presente che, per lo stesso motivo, le 'parole' (cioè le stringhe di caratteri) DEVONO essere in minuscolo.
  10.  
  11. Copiato !ANALYSIS sull' hard disk,lo si ponga in una sua directory, dopo il suo uso è, genelmente, intuitivo: lo si lancia nel solito modo, poi, quando la sua icona si è installata nella barra delle icone, si "trascina" con il mouse l'icona del testo da analizzare; a questo punto si "apre" una finestra con il menu'; a seconda del tipo di analisi si aprono dei sub-menu'; inserire opportunamte le scelte, ricordandosi di premere sempre "return" dopo ogni selezione. Per le analisi"concordanze" e "kwic" è possibile restringere il campo da analizzare ( "Elencare solo...") e limitare il brano da analizzare utilizzando dei caratteri particolari(tipo "@" e "$"), con cui si è precedentemente 'marcato' il testo e delle parole( in questo caso, per evitare errori, di almeno quattro caratteri).E' necessario usare le MINUSCOLE: TUTTO il testo originale è automaticamente convertito in lettere minuscole.
  12.  
  13. a) Concordanza,calcolo della frequenza delle parole-forme, un lista di parole contenute nel testo da esaminare con l'indicazione delle righe in cui ogni parola si trova; 
  14. b): KWIC, un particolare tipo di concordanza in cui  le parole di un testo, in ordine alfabetico, sono poste al centro della riga all' interno della quale si trovano( Parole nel Contesto,elenchi di parole-forme cui sono associati i contesti in cui compaiono)
  15. c)indici statistici
  16. d): Lista di frequenza delle parole
  17. e):  Statistiche  varie sul periodo o frase.
  18. Indice di leggibilita` su formula elaborata dal Gruppo di Roma: il programma , che non funziona con testi poetici o testi troppo brevi (da' un risultato inattendibile), da` come risultato un indice: 2-4 indica un testo di leggibita` buona; 6 indica un testo difficilissimo; meno di 2 indica un testo sempre piu` facile da comprendere,ma anche povero stilisticamente e sintatticamente( la formula del Gruppo di Roma calcola
  19. l'indice di leggibilità R nel modo seguente:
  20.  
  21.  R = h - 30/l
  22.  
  23. dove h è la lunghezza media delle parole e l la lunghezza media delle frasi lunghe). In riferimento a una popolazione di studenti di scuola media, se R è maggiore di 6 il testo dovrebbe risultare quasi incomprensibile; se è minore di 3 dovrebbe risultare estremamente semplice; tra questi estremi la leggibilità dovrebbe assumere valori intermedi.; il risultato dovrebbe essere integrato con il confronto del testo da analizzare con un dizionario di frequenza : in tale modo si avrebbe , anche, un elenco delle parole la cui comprensione richiede un livello di conoscenza della lingua elevato.
  24.  
  25. L' altro indice di leggibilita` è il "Gulpease". Il GULP, Gruppo universitario linguistico-pedagogico,ha elaborato un indice legato alla formazione culturale del lettore (popolazione A, V elementare, popolazione B,III media, popolazione C, V superiore; "con riferimento alla popolazione B, se  un testo ottiene un punteggio
  26. -superiore a 60 il lettore è in grado di leggere il testo in modo autonomo(livello di lettura indipendente;
  27. -tra 59 e 40 lo studente ha bisogno di aiuto per comprendere bene il testo (livello di lettura scolastica
  28. -inferiore a 40 lo studente proverà nel leggere il testo la frustrazione di non essere in grado di comprenderlo (livello di frustrazione)." (in Lucisano-Piemontese, GULPEASE: una formula per la predizione della difficoltà dei testi in lingua italiana, in Scuola e Città, 3-1988, a cui si rimanda per un approfondimento del problema.
  29. Il rapporto tra la popolazione B e C può essere definito dalla formula Fac A=0.66(facB)+42.69; errore standard 4.6 e tra la popolazione B ed A da FacA=1.32(facB)-38.62;errore standard 8.7(ibidem).
  30. Si ringrazia il GULP   per la  cortese disponibilità.
  31. f)Co-occorrenze: contemporanea presenza di due lemmi all'interno di un periodo. Indicare le due parole utilizzando il menù , ricordando di premere 'Return' dopo ogni selezione.L'intervallo può essere deciso dall'utilizzatore. Se nelle due finestre si pone la stessa parola, si avra' un particolare tipo di concordanza (la parola e il contesto, allargato al periodo, in cui essa si trova); se nelle due finestre si pone  una stessa stringa,   allora la ric