Università degli Studi di Pavia
Home › Didattica › Corsi › LINGUISTICA APPLICATA
Primo modulo:
Prova orale di verifica dell’apprendimento dei contenuti del corso.
Indagine corpus-based di un problema linguistico a scelta dello studente.
Elaborato scritto di 8 cartelle riportante i risultati dell'analisi empirica.
Secondo modulo:
Elaborato scritto (8 cartelle) relativo all'attività di annotazione e analisi di testi tratti dal corpus CLIPS.
Nozioni di base di Linguistica generale. Buona conoscenza della lingua italiana.
L’uso di corpora per l’analisi linguistica
Il corso è suddiviso in due moduli.
Il primo modulo approfondisce le modalità di analisi linguistica, specialmente semantico-lessicale, attraverso l'uso di corpora. Lo studente sarà in grado di pianificare e condurre l'analisi di un fenomeno linguistico utlizzando metodologie e stumenti provenienti dalla linguistica dei corpora e dalla linguistica computazionale.
1. Cosa è un corpus
2. Metodi e strumenti per interrogare i corpora
3. Annotazione e mark-up
4. Le espressioni regolari
5. Frequenza e Misure di Associazione
6. Tipi di corpora
7. Esempi di analisi linguistica corpus-based e corpus-driven
Il secondo modulo introduce alle specificità dei corpora di parlato.
1. Il parlato: peculiarità semiotiche e linguistiche
2. Problemi metodologici della realizzazione di un corpus di parlato
3. Unità di analisi per il parlato
Primo modulo:
Baroni M. and A. Kilgarriff. 2006. “Large Linguistically-Processed Web Corpora for Multiple Languages”. In Proceedings of EACL 2006 (European Association for Computational Linguistics), 87-90.
Jezek, Elisabetta 2005. Lessico. Classi, Strutture, Combinazioni. Bologna: Il Mulino.
Kilgarriff A., Rychlý, P., Smrž, P. Tugwell,D. 2004. "The Sketch Engine". In Williams G. and S. Vessier (eds.), Proceedings of the XI Euralex International Congress, July 6-10, 2004, Lorient, France. 105-111.
Lenci A., Montemagni S., Pirrelli V. 2005. Testo e Computer – Cap. 8: “L’annotazione linguistica del testo”, Roma: Carocci.
Secondo modulo:
Cameron, D. 2001.Working with spoken discourse, London: Sage. (capp.1-3; 6-7)
Foster, P. et al. 2000. Measuring spoken laguage: a unit for all reasons, Applied Linguistics 21/3: 354-375
Cresti, E., Moneglia, M. (eds.) 2005. C-ORAL-ROM : integrated reference corpora for spoken romance languages, Amsterdam: Benjamins. (cap.6)
Voghera, M. 1991, Sintassi e intonazione nell’italiano parlato, Bologna: il Mulino. (capp.1,2, 5)
MacWhinney?, B. 2009. The CHILDES Project. Tools for Analyzing Talk – Electronic
Edition. [http://childes.psy.cmu.edu/manuals/clan.pdf. Ed. italiana: Il progetto CHILDES, Strumenti per l’analisi del linguaggio parlato, Pisa, del Cerro, 1997.]
Documenti di presentazione del corpus CLIPS scaricabili da http://www.clips.unina.it.
L’uso di corpora per l’analisi linguistica
Il corso approfondisce le modalità di analisi linguistica, specialmente semantico-lessicale, attraverso l'uso di corpora. Lo studente sarà in grado di pianificare e condurre l'analisi di un fenomeno linguistico utlizzando metodologie e stumenti provenienti dalla linguistica dei corpora e dalla linguistica computazionale.
1. Cosa è un corpus
2. Metodi e strumenti per interrogare i corpora
3. Annotazione e mark-up
4. Le espressioni regolari
5. Frequenza e Misure di Associazione
6. Tipi di corpora
7. Esempi di analisi linguistica corpus-based e corpus-driven
Baroni M. and A. Kilgarriff. 2006. “Large Linguistically-Processed Web Corpora for Multiple Languages”. In Proceedings of EACL 2006 (European Association for Computational Linguistics), 87-90.
Jezek, Elisabetta 2005. Lessico. Classi, Strutture, Combinazioni. Bologna: Il Mulino.
Kilgarriff A., Rychlý, P., Smrž, P. Tugwell,D. 2004. "The Sketch Engine". In Williams G. and S. Vessier (eds.), Proceedings of the XI Euralex International Congress, July 6-10, 2004, Lorient, France. 105-111.
Lenci A., Montemagni S., Pirrelli V. 2005. Testo e Computer – Cap. 8: “L’annotazione linguistica del testo”, Roma: Carocci.
Introduzione ai corpora di parlato.
1. Il parlato: peculiarità semiotiche e linguistiche
2. Problemi metodologici della realizzazione di un corpus di parlato
3. Unità di analisi per il parlato
Il parlato:
- Cameron, Deborah (2001), Working with spoken discourse, London, Sage. (capp.1-3; 6-7)
Unità di analisi e morfosintassi nel parlato:
- Foster, Pauline et al. (2000), Measuring spoken laguage: a unit for all reasons, Applied Linguistics 21/3: 354-375
- Cresti, Emanuela, Moneglia, Massimo (eds.) (2005), C-ORAL-ROM : integrated reference corpora for spoken romance languages, Amsterdam, Benjamins. (cap.6)
- Voghera, Miriam (1991), Sintassi e intonazione nell’italiano parlato, Bologna, il Mulino. (capp.1,2, 5)
Per il lavoro seminariale si consulteranno:
- MacWhinney?, B. (2009). The CHILDES Project. Tools for Analyzing Talk – Electronic
Edition. [http://childes.psy.cmu.edu/manuals/clan.pdf. Ed. italiana: Il progetto CHILDES, Strumenti per l’analisi del linguaggio parlato, Pisa, del Cerro, 1997.]
- Documenti di presentazione del corpus CLIPS scaricabili da http://www.clips.unina.it.
Nessuna prova presente
Università degli Studi di Pavia
Segreteria amministrativa: Piazza Botta, 6 - 27100 Pavia
Segreteria didattica: Corso Strada Nuova, 65 - 27100 Pavia
Sezioni del Dipartimento
Email: webmaster.lettere (at) unipv.it