Università degli Studi di Pavia
Home › Didattica › Corsi › Linguistica computazionale (c.p.)
Il ciclo di seminari si propone di discutere alcuni temi attuali nel Trattamento Automatico del Linguaggio Naturale (TALN). Negli ultimi anni, la Linguistica e la Linguistica Computazionale vengono spesso chiamate a proporre soluzioni sul piano teorico ed applicativo, in una societa’ in cui la comunicazione e la circolazione su larga scala dell’informazione diventano centrali.
La proposta di corso progredito riguarda tre tematiche, in alternativa.
Proposta 1:
Risorse lessicali ed il loro impiego in applicazioni
Modelli computazionali per la rappresentazione del significato lessicale:
1. Modello relazionale
2. Modello a Frame (ruoli tematici)
3. Modello misto: PAROLE/SIMPLE CLIPS
Tecniche per il reperimento di informazione: dal reperimento, in vaste collezioni, dei documenti pertinenti, verso l’estrazione di informazione dal contenuto di un documento. (Information Retrieval vs. Information Extraction).
Sistemi di Domanda/Risposta non vincolati al dominio (Open Domain Question-Answering)
I Lessici semantici in applicazioni - estrazione di informazione, sommarizzazione, Sistemi di domanda-risposta non ristretti al dominio(OD-QA).
Marius Pasca, Open-Domain Questio Answering from Large Text Collections. CSLI Publications, 2003
Proposta 2:
La soggettivita’ nella comunicazione: affetti, emozioni, opinioni, stati d’animo.
Human Computer Interaction à creare interfacce uomo-macchina piu’ amichevoli.
Analisi del testo
Risorse lessicali: WordNet-Affect, SENTI-WordNet
Generazione di testo
Corpora e Schemi di annotazione:
§ Appraisal Theory
§ Annotazione di opinioni
§ EARL: un linguaggio per l’annotazione della soggettivita’.
HUMAINE:http://emotion-research.net
Susan Huston & Geoff Thompson (eds) Evaluation in Text, Oxford University Press
Appraisal Theory. J. Martin: http://www.grammatics.com/appraisal/index.html
Proposta 3:
Una robusta capacità d’identificazione e di estrazione degli eventi e del loro ancoraggio temporale nel testo è motore per compiere inferenze basilari, e questo è un componente chiave per poter accedere all’informazione presente nel testo attraverso il contenuto anziché tramite parole-chiave,
essenziale in applicazioni come Estrazione di Informazione, Open-Domain Question Answering, sommarizzazione, ecc.
Mani I., Pustejovsky J., Geisauskas R., The Language of Time. Oxford University Press, 2005
Pustejovsky, J., J. Castaño, R. Ingria, R. Saurí, R. Gaizauskas, A. Setzer and G. Katz. 2003.
TimeML: Robust Specification of Event and Temporal Expressions in Text. IWCS-5, Fifth International Workshop on Computational Semantics.
James Pustejovsky, Patrick Hanks, Roser Saurí, Andrew See, Robert Gaizauskas, Andrea Setzer, Dragomir Radev, Beth Sundheim, David Day, Lisa Ferro and Marcia Lazo. 2003. The TIMEBANK Corpus. /Proceedings of Corpus Linguistics 2003/: 647-656.
Il presente programma e’ soggetto a cambiamenti, integrazioni e personalizzazioni a seconda degli interessi specifici degli studenti. Per chi scegliesse di seguire questo corso e’ consigliato avere seguito prima almeno uno di questi corsi: Linguistica Computazionale (corso base), Informatica di Base (Prof. Vito Pirelli), Laboratorio (Prof. Andrea Sanso’).
Nessuna prova presente
Università degli Studi di Pavia
Segreteria amministrativa: Piazza Botta, 6 - 27100 Pavia
Segreteria didattica: Corso Strada Nuova, 65 - 27100 Pavia
Sezioni del Dipartimento
Email: webmaster.lettere (at) unipv.it