Nel numero di settembre 2007

Testo

Si occupa di sviluppare tecnologie di question answering e, più in generale, tecnologie di analisi automatica del linguaggio naturale QuestIT srl, l’ultimo nato tra gli spin-off dell’Università di Siena.

Da poco, infatti, il Liaison office, struttura di riferimento per l’imprenditorialità accademica, ha ultimato la fase autorizzativa per la creazione dell’azienda. A Marco Ernandes, uno dei responsabili di QuestIT srl, abbiamo chiesto quali siano le motivazioni che hanno portato alla costituzione dello spin-off e quali gli sviluppi che possono nascere dallo studio e dall’implementazione di questo tipo di tecnologie.

D. Come nasce l’idea di creare uno spin-off per lo studio e l’analisi di tecnologie di question answering?

R. Lo spin-off QuestIT srl è nato da pochi mesi, ma l’idea di creare un’azienda con queste caratteristiche prende forma nel 2006, a seguito di una serie di stimoli che provenivano dall’ambiente accademico e dal mondo industriale.
In ambito universitario, sulla base di un progetto di ricerca del dipartimento di Ingegneria dell’Università di Siena, era stato da poco sviluppato Web Crow (http://webcrow.dii.unisi.it/webpage/index.html), sistema automatico di risoluzione dei cruciverba, finanziato per due volte dal portale Google.
Dal settore industriale, contemporaneamente, avvertivamo un crescente interesse da parte di alcune aziende leader per questa tecnologia. Da questi stimoli esterni è nata la volontà di ingegnerizzare il progetto, per creare un prodotto da destinare al pubblico; volontà che si è concretizzata in una collaborazione con l’azienda Expert System http://www.expertsystem.it, leader nel settore della linguistica computazionale e specializzata nella tecnologia dei significati, per la realizzazione del software di question answering, attualmente in fase di sviluppo e ricerca proprio presso lo spin-off.
Oggi la nostra azienda, la cui sede attuale è presso il dipartimento di Ingegneria dell’Ateneo senese, è composta da quattro soci operativi: con me, infatti, lavorano Giovanni Angelini, Ernesto Di Iorio, Leonardo Rigutini; ci avvaliamo, inoltre, della collaborazione di due docenti dell’Ateneo senese, Marco Maggini e Marco Gori.D.

D. Il question answering nasce dal connubio tra l’informatica e la semantica, la scienza dei significati delle parole. In termini pratici, come funziona e quali sono le prospettive dell’utilizzo di questa tecnologia?
R. Il nostro studio mira alla realizzazione di un software che risponda in maniera automatica e puntuale alle domande poste nel linguaggio naturale, attraverso una risposta singola o multipla sul tema richiesto. Il software potrebbe sostituire o, più facilmente, integrare i motori di ricerca (che al momento non eseguono alcun tipo di analisi linguistica); nell’atto della formulazione di una risposta, infatti, la nuova tecnologia applicherebbe la semantica ai dati e alle informazioni possedute, fornendo così non solo il significato delle parole in questione, ma anche le eventuali relazioni tra le parole e i loro significati. Il question answering, interpretando le query di ricerca già fin dalla formulazione della risposta, potrebbe supportare l’attività di un motore di ricerca del web, o avere una funzione locale di filtro all’interno di una serie di documenti, in modo da fornire una presentazione alternativa e puntuale dei dati. Questo consentirebbe di ottenere una maggiore qualità delle informazioni trovate e di ridurre il tempo di ricerca, consentendo di raggiungere nozioni più precise senza correre il rischio di trovare notizie non utili.

La difficoltà maggiore del progetto è quella di eliminare le ambiguità; le parole sono sottoposte, così, a un processo di disambiguazione semantica. In pratica, il software realizzerà l’analisi grammaticale, sintattica e semantica dei dati immessi, e in base a tale analisi stabilirà quale tipo di risposta fornire alle domande poste dall’utente.
Faccio un esempio: se il software trova la parola pesca in un documento, la mette in relazione con il significato del documento che la contiene, così da capire se si tratta di un frutto, di un hobby o di uno sport.

Attualmente, comunque, il nostro interesse prioritario non è relativo all’utilizzo del question answering nell’ambito di un motore di ricerca, quanto all’applicazione del software all’interno delle aziende.

D. In che termini tale tecnologia può essere applicata alle aziende? Quali sono le prospettive di applicazione in campo nazionale e internazionale?

R. A livello nazionale il software potrebbe essere impiegato nelle aziende, per esempio nelle pubbliche amministrazioni, nel tentativo di ridurre il problema della ricerca tra archivi di documenti ampi e complessi.
Attraverso l’utilizzo del software di question answering, ad esempio, una pubblica amministrazione potrebbe fornire una guida veloce e pratica al dipendente perché questi possa raggiungere velocemente e con risultati di qualità le informazioni desiderate tra la mole di informazioni presenti.
È chiaro che in ogni caso il software andrebbe adattato alle esigenze specifiche di ogni azienda, per la differente tipologia di dati, i diversi layout grafici e i tipi di file utilizzati. Per questa ragione, prima di applicare il software alle aziende, sarà necessario seguire alcune tappe: l’analisi dei documenti, l’estrazione delle varie tipologie, l’indicizzazione e, dunque, lo sviluppo del sistema di question answering.
Tale software potrebbe sostituire anche le FAQ (Frequently Asked Questions), molto costose in termini di produzione e a rischio di incompletezza. Il software di question answering ha una barriera tecnologica molto forte, che è la lingua di riferimento. Negli Stati Uniti, ormai da un paio di anni, vengono finanziati grossi progetti per lo studio di queste tecnologie, mentre in Italia esistono solo piccole sperimentazioni in ambito accademico. Oggi è impossibile pensare che una sola azienda riesca a realizzare questo servizio in tutte le lingue del mondo, quindi ciascun paese svilupperà le proprie conoscenze e competenze in maniera autonoma. Si può ipotizzare che gli americani penseranno prima a creare un sistema per l’inglese, poi per lo spagnolo e per il tedesco.
Questa situazione consentirà che, nel nostro paese, si riesca a portare avanti lo sviluppo di un software per la lingua italiana senza invasioni di campo da parte del mercato internazionale.

Il software di question answering sarà un sistema intelligente, che si avvarrà del connubio tra intelligenza umana e artificiale. Per l’inverno che arriva si otterrà un prodotto base della versione del software: tra un paio d’anni puntiamo a ottenere un sistema di qualità.

Guarda l’elenco degli altri spin-off dell’Università di Siena.

"Le News di Liaison on line"
è un supplemento a "l'UNIVERSITÀ DI SIENA - lettera d'informazione"
Scrivi alla redazione

Liaison Office
Web: http://www.unisi.it/liaison
Tel. 0577 232187 - fax 0577 282188