Séminaire de linguistique – Théories et pratiques linguistiques
12 novembre - 15h00 à 17h00
Recherches contrastives en linguistique romane
Gorana Bikić Carić, université de Zagreb
Résumé :
Dans cette communication, nous nous proposons de présenter le corpus RomCro, conçu à la Faculté de philosophie et lettres de l’Université de Zagreb, et de montrer ses apports aux recherches contrastives en linguistique romane.
RomCro est un corpus parallèle multilingue et multidirectionnel qui contient des textes littéraires écrits en français, espagnol, italien, portugais, roumain et croate. Toutes les langues sont représentées avec des textes originaux et leurs traductions. Nous développons ce corpus depuis novembre 2019 dans le cadre d’un projet conçu à la Chaire de linguistique romane du Département d’études romanes, Faculté de philosophie et lettres de l’Université de Zagreb en Croatie. En ce moment, le corpus comprend une trentaine de romans du XXème et du XXIème siècles et environ 16 millions de mots. Il est composé de phrases alignées et il est lemmatisé et annoté morphologiquement, ce qui signifie qu’il peut donner des informations non seulement sur les traductions d’un mot, mais aussi sur l’emploi des catégories grammaticales. Il est accessible sur la plateforme Sketch Engine et, en version non lemmatisée, sur la plateforme ELRC (European Language Resource Coordination) 17, sous licence CC-BY-NC-4.0 (Bikić-Carić / Mikelenić / Bezlaj 2023). Le corpus est prévu exclusivement pour l’utilisation académique et non commerciale. Afin de protéger les droits d’auteur, l’ordre des phrases est aléatoire et il n’est pas possible de récupérer un texte dans sa totalité. Nous voudrions souligner le fait que c’est le seul corpus où sont présentés cinq langues romanes et le croate, ce qui le rend incontournable pour des recherches dans le domaine de linguistique contrastive romane en partant d’une langue slave, le croate, mais il peut être très utile aussi pour les romanistes en général, de même que pour les traducteurs ou les professionnels de l’enseignement.
Nous avons utilisé le corpus RomCro, depuis sa création, dans plusieurs recherches sur la détermination du nom (Bikić-Carić / Bezlaj 2020, Bikić-Carić 2020, Bikić-Carić 2022, Bikić-Carić / Bezlaj 2023, Mikelenić / Bikić-Carić 2023, Bikić-Carić / Căpăţînă 2024) et sur l’emploi de l’infinitif (Bezlaj / Bikić-Carić 2021). Comme nous allons le montrer, nous trouvons la comparaison des phrases alignées très utile dans le but de mieux comprendre non seulement les différences et similarités entre les langues, mais aussi le fonctionnement de chacune d’entre elles.