Comparaison de la validité de différentes mesures statistiques pour l'extraction de collocations fondamentales dans un corpus issu du Web - Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Comparaison de la validité de différentes mesures statistiques pour l'extraction de collocations fondamentales dans un corpus issu du Web

Résumé

L'étude présentée ici est tirée d'un travail de recherche plus vaste, une thèse de doctorat portant sur le concept de « collocation fondamentale », étudié à partir de l'analyse d'un corpus de grande dimension tiré du Web (Benigno, 2011). L'apprentissage du vocabulaire d'une langue seconde est un processus d'acquisition progressif dont la première étape est la maîtrise du vocabulaire fondamental, comprenant les unités les plus simples et les plus fréquentes, réputées pour leur utilité dans les actes communicatifs de la vie quotidienne. De Henmon (1924) à Gougenheim (1954) pour le français, de Thorndike (1929) à West (1950) pour l'anglais, de nombreux auteurs ont très tôt cherché à définir, à caractériser et à énumérer ces unités formant le socle de l'acquisition du lexique. Mais les unités fondamentales ne forment pas une liste de mots isolés : ces mots s'inscrivent dans des ensembles plus larges, que l'on parle d'expressions préfabriquées, de combinaisons typiques ou de simples collocations. Dans cette perspective, on peut définir les collocations fondamentales comme des unités significatives, fondées sur une relation comportant un certain degré de figement entre une base et un collocatif, fréquentes dans l'usage et conceptuellement disponibles (Gougenheim, 1958). Ces unités, qui représentent les co-occurrences les plus élémentaires d'un mot simple donné, correspondent aux réalisations les plus fréquentes, en contexte, de ses différents sens. De très nombreux travaux se sont attachés à la définition du concept de collocation (Hausmann, 1979, Mel'cuk, 1984, Williams, 2003, Grossmann et Tutin 2003), celui-ci pouvant s'appliquer à des unités allant de la combinaison libre aux expressions idiomatiques totalement figées, mais l'intérêt s'est plus souvent porté sur les langues de spécialité que sur la langue générale ; en outre, bien que ces phénomènes aient été largement traités dans les recherches sur l'enseignement d'une langue seconde, peu d'études se sont intéressées à la notion de collocation fondamentale.
Fichier principal
Vignette du fichier
Benigno - Kraif.v1.pdf (62.97 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03654286 , version 1 (28-04-2022)

Identifiants

  • HAL Id : hal-03654286 , version 1

Citer

Veronica Benigno, Olivier Kraif. Comparaison de la validité de différentes mesures statistiques pour l'extraction de collocations fondamentales dans un corpus issu du Web. Rencontres phraséologiques, Nov 2013, Grenoble, France. ⟨hal-03654286⟩

Collections

LIDILEM
20 Consultations
2 Téléchargements

Partager

Gmail Facebook X LinkedIn More