ftp.disi.unige.it

home *** CD-ROM | disk | FTP | other *** search

/ ftp.disi.unige.it / 2015-02-11.ftp.disi.unige.it.tar / ftp.disi.unige.it / pub / .person / MascardiV / click.txt next >

Wrap

Text File | 2002-03-06 | 3KB | 101 lines

1.1 Piu' che stato dell'arte lo chiamerei introduzione o "Temi della ricerca" Il gruppo di statistical learning del DISI si propone di studiare e sviluppare metodi per soluzione di problemi di classificazione basata su contenuto nel caso di documenti e immagini a partire da esempi. Sono stati individuati tre gruppi di problemi che vengono brevemente esposti nell'ordine di priorita' concordato. Il primo riguarda la capacita' di classificare sulla base del contenuto testi semistrutturati a partire da una serie di esempi resi disponibili nella fase di addestramento. Il secondo concerne la possibilita' di individuare la tipologia e la combinazione di colori presumibilmente graditi a un dato utente sulla base di esempi (cioe' immagini) positivi e negativi (cioe' graditi o meno dall'utente stesso. Il terzo gruppo consiste nel trovare e oscurare in un'immagine quegli elementi (quali, ad esempio, targhe, nomi di vie, volti di persone) che consentono l'identificazione precisa di luoghi e/o soggetti al fine di garantire l'anonimato. Il lavoro si sviluppera' in tre fasi, ciascuna della durata di 6 mesi. PRIMA FASE Nella prima fase si passeranno in rassegna le principali tecniche e metodologie proposte in letteratura. Nel caso dei testi in funzione della quantita' di dati disponibili si studieranno le tecniche di statistical learning relative al caso di classificazione supervisionata e parzialmente supervisionata. Particolare attenzione verra' riposta allo studio di appropriate funzioni kernel e al problema della scelta del kernel [XXX qualche citazione kermit]. Nel caso delle immagini si procedera' in due direzioni parallele. La prima in completa analogia al caso precedente prevede lo studio di metodi di statistical learning applicati a immagini e di funzioni kernel dedicate. La seconda nella ricerca delle tecniche per l'identifazione e localizzazione in immagini di oggetti di interesse (volti, scritte, etc) ad ampio spettro e basate su metodologie sia di computer vision sia di statistica avanzata. Contemporaneamente in questa prima fase verranno chiariti i punti e i singoli problemi di maggiore interesse fino alla stesura di specifiche concordate. PER VIVIANA: anche in questo caso diamo ampia disposizione a fare seminari o lezioni "a comando" sui temi che risultino di maggiore interesse. Anzi, io prometterei questa cosa in tutte e tre le fasi. Per chi lavora in aziende 6 mesi sono un'eternita'. Magari non bruciamo tutto subito e raccontiamo le cose nel corso dei 18 mesi. Qui promettiamo solo report. SECONDA FASE Nella seconda fase individuate le tecniche piu' promettenti per i problemi selezionati si intende procedere a una prima versione prototipale e validazione dei moduli software realizzati all'uopo. Per tutte e tre le tipologie di problemi sopracitati si prevede la necessita' di sviluppare funzioni kernel appropriate e di selezionare il modello di apprendimento piu' adatto. Ove necessario potrebbe rivelarsi importante l'utilizzo di metodi di apprendimento alternativi e/o ibridi. Qui promettiamo release di prototipo software o di puntatori a software opensource o commerciale e risultati di una prima sperimentazione. TERZA FASE Nella terza fase intendiamo da un lato procedere alla valutazione estensiva delle tecnologie sviluppate e dall'altro un miglioramente dei prototipi insieme a una descrizione dettagliata delle loro strutture. Qui promettiamo report finale e prototipo finale. TERZA FASE