Présentation

Cette journée d'atelier est organisée dans le cadre du Réseau thématique en Acquisition des Langues Secondes (RéAL2). Elle porte sur l'Outillage de l'ACQUIsition des Langues secondes et cette année tout particulièrement sur la reconnaissance vocale et la transcription automatique. Elle a lieu le mardi 13 janvier 2026 en ligne, de 9h30 à 16h30.

Informations

  • Organisation : Sarra El Ayari (Structures Formelles du Langage, CNRS & Univ. Paris 8) , Pascale Leclercq (Etudes Montpelliéraines du Monde Anglophone, Univ. Paul-Valéry Montpellier 3) et Mireille Copin (Univ. de Tours).
  • Public visé : masterant·es, doctorant·es, jeunes chercheur·ses (et toutes autres personnes intéressées !)
  • Inscription gratuite et obligatoire (onglet Inscription)
  • Format : en ligne
  • Langue : français / pas d'interprétation en LSF

 

Déroulé

 La journée se déroulera en deux temps :


1) Le matin : des présentations brèves (20 minutes) de retours d'expérience sur la transcription automatique d'énoncés d'apprenants, suivies d'une table ronde 

2) L'après-midi : Deux ateliers pratiques de transcription orthographique automatique avec Whisper (via Sharedocs d'Huma-Num) et de génération d'API avec Phon.

 

Nos intervant·es :

- Brigitte Bigi (Université d'Aix en Provence)

- Mireille Copin (Université de Tours)

- Sarra El Ayari (CNRS & Université Paris 8)

Thomas Gaillat & Patrick Jen-Yu Li (Université de Rennes)

- Pascale Leclercq (Université Paul Valery, Montpellier)

- Loïc Liégeois (Université de Clermont-Ferrand)

 

Cadrage général

Cette journée d'atelier est organisée dans le cadre du Réseau thématique en Acquisition des Langues Secondes (RéAL2). Elle porte sur l'Outillage de l'ACQUIsition des Langues secondes et cette année tout particulièrement sur la reconnaissance vocale et la transcription automatique. Elle a lieu le mardi 13 janvier 2026 en ligne, de 9h30 à 16h30.


La transcription est une activité essentielle, mais chronophage, pour la constitution et l’analyse de corpus oraux (Ochs, 1979 ; Mondada 2000, 2007 ; Leclercq, 2020 ; Benazzo & Watorek, 2022), dont la durée peut varier parfois du simple au double selon le niveau de détail que l’on souhaite annoter, ou le nombre de vérification de la transcription que l’on souhaite faire (Parisse & Morgenstern 2010). La transcription, qui constitue une première étape dans la catégorisation des données, à travers notamment les choix d’encodage orthographique ou phonétique, engage le chercheur, en le forçant à effectuer des choix interprétatifs précoces, souvent contraints par le cadre théorique choisi. Ces choix conditionnent les analyses subséquentes, C’est ce que Mondada (2007) appelle le biais interprétatif ; et s’il est envisageable de proposer un codage permettant des interprétations alternatives, il n’est pas possible de le faire sur l’ensemble des éléments d’une transcription (Morgenstern & Parisse, 2007). Or, ces choix sont particulièrement cruciaux lors de l’analyse des discours d’apprenants, qui s’écartent souvent de la norme des locuteurs natifs. Dans l’exemple (1) tiré de Leclercq (2020), le son [e] réfère-t-il à l’infinitif, l’imparfait, le participe passé, ou même à une forme erronée de présent ? Quelle est l’intention de communication derrière l’utilisation de cette forme ?
(1) le cheval essayE de monter le barrière (EngL1 FrL2 MAG, intermediate)


Si ces questions sont centrales au travail d’analyse du chercheur, le processus de transcription, jusqu’à présent manuel et très coûteux en temps et en moyens humains, se trouve actuellement bouleversé par l’utilisation de l’IA. De nombreux outils émergent permettant de transcrire en un temps record des données enregistrées, monolingues ou même bilingues. Ces outils, le plus souvent commerciaux, ne donnent que peu d’informations sur le traitement et la sécurité des données qui leur sont confiées, alors même que toute recherche doit répondre à des critères stricts de gestion et protection des données (RGPD). D’autres outils open source semblent être des alternatives possibles (par exemple Whisper hébergé par Huma-Num2, voir Gaide, 2023). Ces outils ouvrent de nouvelles perspectives aux chercheur·ses, notamment en termes de gain de temps, mais quelles sont les véritables performances de ces outils à l’heure actuelle – notamment en ce qui concerne la parole non normée d’apprenants (El Ayari & Li, 2024) ? Quelles sont les langues pour lesquelles une transcription automatique est possible ? Quel type d’analyse linguistique (phonétique, morphologie, discours, etc.) est envisageable à partir d’une transcription automatique ? Par ailleurs, quels sont les points de vigilance à garder en tête lors de leur utilisation ? Les bonnes pratiques pour une recherche valide et éthique ? Nous ferons le point sur les nouveaux outils et les pratiques à adopter.

Références

  • Ballier, N., Burin, L., Namdarzadeh, B., Ng, S., Wright, R., & Yunès, J.-B. (2024). Probing Whisper Predictions for French, English and Persian Transcriptions. 7, 129-138. https://hal.science/hal-04912112
  • Ballier, N. & Méli, A. (2024). Investigating Acoustic Correlates of Whisper Scoring for L2 Speech Using Forced
    Alignment with the Italian Component of the ISLE corpus. In T. Gaillat, C. Mallart, F. Moreau, J.-Y. Li, G. Drouet, D. Alfter, E. Volodina, & A. Jönsson (Éds.), Proceedings of the Workshop on Natural Language Processing for Computer Assisted Language Learning (Vol. 13), pp. 20-32. https://aclanthology.org/2024.nlp4call-1.2
  • Ballier, N., Taylor, A., Méli, A., Thurston, T., & J.-B. Yunès. (2024). Whisper for L2 speech scoring. International
    Journal of Speech Technology, 27(4), pp. 923-934. https://doi.org/10.1007/s10772-024-10141-5
  • Benazzo, S., & Watorek, M. (2021). Transcription de corpus oraux d’apprenants débutants en français L2 : Quelques enjeux théoriques. In In L. Spreafico, G. Bernini, A. Valentini & J. Saturno (Eds.) Superare l’evanescenza del parlato. Un vademecum per il trattamento digitale di dati linguistici, pp. 127-165. https://hal.archives-ouvertes.fr/hal-03312984
  • El Ayari, S. & Li, Z. (2024). Potential of ASR for the Study of L2 Learner Corpora. In T. Gaillat, C. Mallart, F. Moreau, J.-Y. Li, G. Drouet, D. Alfter, E. Volodina, & A. Jönsson (Éds.), Proceedings of the Workshop on Natural Language Processing for Computer Assisted Language Learning (Vol. 13), pp. 49-58. https://aclanthology.org/2024.nlp4call-1.4
  • Gaide, A. (2023). Retranscrire avec whisper via huma-num [Billet du 6 novembre]. Âge et pouvoir.
    https://doi.org/10.58079/vfmr
  • Leclercq, P. (2020). Transcribing interlanguage : The case of verb-final [e] in L2 French. In Interpreting language-learning data. Language Science Press. https://doi.org/10.5281/zenodo.4032298
  • Liégeois, L. (2025). Des bruits dans mon corpus : des données à réduire au silence, à atténuer ou à écouter attentivement ? Corpus [En ligne], 26. http://journals.openedition.org/corpus/10127
    Lorenza Mondada, (2007), Commentary: transcript variations and the indexicality of transcribing practices, Discourse Studies, vol. 9, no. 6, pp. 809–821.
  • Morgenstern, A. & Parisse, C. (2007). Codage et interprétation du langage spontané d’enfants de 1 à 3 ans, Corpus [En ligne], 6. https://doi.org/10.4000/corpus.922
  • Ochs, E. (1979). Transcription as Theory. In Developmental Pragmatics, E. Ochs and B. Schieffelin. New york: Academic Press, pp. 43-72.
  • Parisse, C. & Morgenstern, A., (2010). Transcrire et analyser les corpus d’interactions adulte-enfant. E. Veneziano, A. Salazar Orvig, J. Bernicot (Eds). Acquisition du langage et interaction, L’Harmattan, pp.201-222.

 

Contact

Si vous avez des questions, vous pouvez nous contacter par mail : oacquil2026(at)sciencesconf.org

 

Chargement... Chargement...