Linguistique de corpus

Linguistique de corpus

Discipline rare Non

Présentation

Linguistique et analyse de documents électroniques

L’utilisation de corpus (ensemble de documents, généralement sous forme électronique) par les linguistes a connu un essor remarquable depuis les années 90, tant pour la publication de dictionnaires, que pour celle de grammaires. Par ailleurs, de plus en plus de chercheurs en linguistique font référence aux corpus existants, comme le British National Corpus (BNC) ou le Corpus of Contemporary American English (COCA), ou bien créent leur propre corpus pour étudier des exemples authentiques en contexte. Enfin, seuls les logiciels d’analyse de corpus permettent d’obtenir des données chiffrées pour dégager les grandes tendances des langues ou vérifier des hypothèses plus pointues. Cette UE permettra aux étudiants de s’initier à l’utilisation de corpus acquis par l’université (dont le BNC ou le London-Lund corpus d’anglais oral) ou à l’analyse de corpus qu’ils constitueront eux-mêmes, et de mettre ainsi leurs connaissances grammaticales, lexicales, phonologiques ou stylistiques à l’épreuve des textes. Elle offrira également une introduction à la recherche dans un domaine de la linguistique en plein essor.

Semestre 2 : Un corpus oral construit

Cours magistral :

Dans ce cours on examinera les rapports entre l’analyse de corpus, la construction d'un discours oral et la théorie prosodique. On fera dans un premier temps une mise à niveau méthodologique sur l’utilisation d’un corpus oral numérisé.

Lecture et discussion d’articles ou extraits d’ouvrages scientifiques qui traitent de questions liées à l'établissement des corpus oraux ainsi qu’à la signification et à la portée des résultats et conclusions que l’on peut tirer de leur étude. Ensuite, nous choisirons des articles de recherche qui illustrent concrètement l’application d’une « analyse de corpus oral » à un problème spécifique en phonologie. Cette partie du cours sera donc orientée sur la préparation à la recherche sur l’anglais spontané.

TD :

L’étudiant(e) apprendra à traiter un corpus restreint de son choix (documents oraux transcrits ou à transcrire, de nature spontanée), et à le mettre sous forme électronique annotée à l’aide d’un traitement de texte et un logiciel de concordance (Ant Conc). Un outil d’analyse prosodique (PRAAT, Speech Analyzer) lui permettra ensuite de mettre manuellement des annotations descriptives sur des éléments sélectionnés du corpus, par rapport aux phénomènes intonatifs : à l'aide du logiciel, l’étudiant(e) obtiendra des données acoustiques chiffrées sur les sons, (syllabes et séquences de mots, expressions courantes ou constructions complexes). On apprendra à les interpréter d’un point de vue phonologique, puis linguistique (l’accent étant mis sur la construction de sens à travers la combinatoire des formes intonatives, syntaxiques et sémantiques). On pourra enfin comparer les résultats obtenus à partir de son corpus (extrait du London-Lund Corpus ICE Corpus of English ou du Santa Barbara Corpus) avec d’autres analyses britanniques ou américaines dans le but de vérifier ses hypothèses sur un ensemble de textes oraux. Cette démarche constitue elle aussi une initiation à la recherche sur la prosodie (phénomènes intonatifs).

  • Modalité de controle: Controle continu

Syllabus

Bibliographie :

Benveniste, E. Problèmes de linguistique générale (vol.2), Paris : Gallimard, 1974.

Brown, G. and Yule, G. Discourse Analysis, Cambridge : CUP, 1983.

Couper-Kuhlen, E. Introduction to English Prosody. Tübingen : Niemeyer, 1986.

Harrington, J. Phonetic Analysis of Speech Corpora. London : Wiley-Blackwell, 2010

Kent, R.D. and Read, C. The Acoustic Analysis of Speech, San Diego, Singular Publishing Group, 1992.

Schiffrin, D., Tannen, D., Hamilton, H.E. The Handbook of Discourse Analysis, Oxford: Blackwell, 2001.

Roach, P. English Phonetics and Phonology: A Practical Course, Cambridge ; CUP, 2009

Wells, J.C. English Intonation: An Introduction, Cambridge ; CUP, 2006

Wichmann, A.  Intonation in Text and Discourse, London ; Longman, 2000.

Wynne, M. (ed.). Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbow Books: 2005.

En ligne à : http://ahds.ac.uk/guides/linguistic-corpora/index.htm

Diplômes intégrant cette UE

En bref

Contact(s)

Composante

Responsable(s)

LABROSSE Pierre

Email : Pierre.Labrosse @ paris-sorbonne.fr

SCHAEFER Steven

Email : Steven.Schaefer @ paris-sorbonne.fr