home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
ftp.disi.unige.it
/
2015-02-11.ftp.disi.unige.it.tar
/
ftp.disi.unige.it
/
pub
/
.person
/
MascardiV
/
click.txt
next >
Wrap
Text File
|
2002-03-06
|
3KB
|
101 lines
1.1 Piu' che stato dell'arte lo chiamerei introduzione
o "Temi della ricerca"
Il gruppo di statistical learning del DISI si propone
di studiare e sviluppare metodi per soluzione di
problemi di classificazione basata su contenuto
nel caso di documenti e immagini a partire da esempi.
Sono stati individuati tre gruppi di problemi che
vengono brevemente esposti nell'ordine di priorita'
concordato. Il primo riguarda la capacita'
di classificare sulla base del contenuto testi
semistrutturati a partire da una serie di esempi
resi disponibili nella fase di addestramento.
Il secondo concerne la possibilita' di individuare
la tipologia e la combinazione di colori
presumibilmente graditi a un dato utente sulla
base di esempi (cioe' immagini) positivi e negativi
(cioe' graditi o meno dall'utente stesso. Il terzo
gruppo consiste nel trovare e oscurare in un'immagine
quegli elementi (quali, ad esempio, targhe, nomi di
vie, volti di persone) che consentono l'identificazione
precisa di luoghi e/o soggetti al fine di garantire
l'anonimato.
Il lavoro si sviluppera' in tre fasi, ciascuna della durata
di 6 mesi.
PRIMA FASE
Nella prima fase si passeranno in rassegna le
principali tecniche e metodologie proposte in letteratura.
Nel caso dei testi in funzione della quantita' di
dati disponibili si studieranno le tecniche di
statistical learning relative al caso di classificazione
supervisionata e parzialmente supervisionata.
Particolare attenzione verra' riposta allo studio
di appropriate funzioni kernel e al problema della
scelta del kernel [XXX qualche citazione kermit].
Nel caso delle immagini si procedera' in due direzioni
parallele. La prima in completa analogia al caso
precedente prevede lo studio di metodi di
statistical learning applicati a immagini e
di funzioni kernel dedicate. La seconda nella ricerca
delle tecniche per l'identifazione e localizzazione
in immagini di oggetti di interesse (volti, scritte, etc)
ad ampio spettro e basate su metodologie sia di computer
vision sia di statistica avanzata.
Contemporaneamente in questa prima fase verranno
chiariti i punti e i singoli problemi di maggiore
interesse fino alla stesura di specifiche concordate.
PER VIVIANA: anche in questo caso diamo ampia
disposizione a fare seminari o lezioni "a comando"
sui temi che risultino di maggiore interesse.
Anzi, io prometterei questa cosa in tutte e
tre le fasi. Per chi lavora in aziende 6 mesi
sono un'eternita'. Magari non bruciamo tutto
subito e raccontiamo le cose nel corso dei 18 mesi.
Qui promettiamo solo report.
SECONDA FASE
Nella seconda fase individuate le tecniche piu' promettenti
per i problemi selezionati si intende procedere a
una prima versione prototipale e validazione dei moduli
software realizzati all'uopo. Per tutte e tre le
tipologie di problemi sopracitati si prevede la necessita'
di sviluppare funzioni kernel appropriate e di selezionare
il modello di apprendimento piu' adatto. Ove necessario
potrebbe rivelarsi importante l'utilizzo di metodi
di apprendimento alternativi e/o ibridi.
Qui promettiamo release di prototipo software o
di puntatori a software opensource o commerciale
e risultati di una prima sperimentazione.
TERZA FASE
Nella terza fase intendiamo da un lato procedere alla
valutazione estensiva delle tecnologie sviluppate
e dall'altro un miglioramente dei prototipi insieme
a una descrizione dettagliata delle loro strutture.
Qui promettiamo report finale e prototipo finale.
TERZA FASE