Home › Didattica › Corsi › Linguistica computazionale (c.p.)
Linguistica computazionale (c.p.)
- Docenti:
- Prodanof Irina
- Anno accademico:
- 2005/2006
- Decreto Ministeriale:
- 509/99
- Descrizione:
- Trattamento Automatico del Linguaggio Naturale (TALN): modelli e tecniche per l'annotazione di corpora, e per l'organizzazione ed il reperimento di informazione in documenti scritti e parlati
Programma
Il ciclo di seminari si propone di discutere alcuni temi attuali nel Trattamento Automatico del Linguaggio Naturale (TALN). Negli ultimi anni, la Linguistica e la Linguistica Computazionale vengono spesso chiamate a proporre soluzioni sul piano teorico ed applicativo, in una societa' in cui la comunicazione e la circolazione su larga scala dell'informazione diventano centrali:
1. Risorse Linguistiche. Annotazione a vari livelli di analisi (trascrizione, fonetico, morfologico, sintattico, semantico, dialogico, pragmatico). Standards, "riutilizzo" ed adeguamento delle risorse alle necessita' dell'utente. XML: uno standard per la descrizione e l'interscambio di risorse linguistiche.
2. Presentazione di alcune Risorse Linguistiche (lessicali e testuali) e di strumenti per la creazione, l'aggiornamento e l'interrogazione. (Wordnet, Framenet, PAROLE/SIMPLE, Tree-bank, corpora annotati, corpora paralleli, ecc.).
3. Ontologie
4. Tecniche per il reperimento di informazione: dal reperimento, in vaste collezioni, dei documenti pertinenti, verso l'estrazione di informazione dal contenuto di un documento. (Information Retrieval vs. Information Extraction).
5. Sistemi di Domanda/Risposta non vincolati al dominio (Open Domain Question-Answering)
6. Tecniche per la disambiguazione semantica.
Bibliografia
Il presente programma e' solo una serie di proposte ed e' soggetto a cambiamenti, integrazioni e personalizzazioni a seconda degli interessi specifici degli studenti. Per chi scegliesse di seguire questo corso e' consigliato avere seguito prima uno di questi corsi: Linguistica Computazionale (corso base), Informatica di Base (Prof. Vito Pirelli), Laboratorio (Prof. Andrea Sanso').
Letture consigliate (per i punti 1 e 2):
Tony M Enery & Andrew Wilson : Corpus Linguistics, Edimburgh University Press, 2nd Edition, 2001
Biber, Conrad & Reppen: Corpus Linguistics: Investigating Language Structure and Use, Cambride University Press, 1998
A.Lenci, S. Montemagni & V. Pirelli: Testo e Computer. Elementi di linguistica computazionale, Carocci editore, 2005
Elenco appelli e prove
Nessuna prova presente
Dipartimento di Studi Umanistici
Università degli Studi di Pavia
Segreteria amministrativa: Piazza Botta, 6 - 27100 Pavia
Segreteria didattica: Corso Strada Nuova, 65 - 27100 Pavia
Sezioni del Dipartimento
Email: webmaster.lettere (at) unipv.it