Le présent projet vise à réaliser une transcription automatique des enregistrements avec un taux d’erreurs proche de 20%. Actuellement les performances de l’intelligence artificielle ont un taux d’erreurs proche de 50% (Whisper, Microsoft…). Ce projet est une collaboration avec S. Madikeri (Computerlinguistik, UZH) et N. Dherbey Chapuis. Les transcriptions seront secondairement corrigées manuellement.
Le corpus FrOMi est longitudinal et constitué des productions orales spontanées de 10 élèves allophones qui ne parlaient pas un mot de français en entrant à l’école, et de 3 élèves de français langue seconde (FLS) qui avaient une maitrise variable du français au moment de leur entrée à l’école. Chaque participant a été enregistré durant un matin d’école (3h15) tous les 3 mois pendant 4 années scolaires. FrOMi est composé de 445 heures d’enregistrements et de leurs transcriptions en français standard.
Le corpus FrOMi offre l’opportunité d’étudier le développement longitudinal du français langue seconde sur une période de 36 mois dans un groupe d’apprenants très jeunes (de 5 à 9 ans) avec des langues premières sous-étudiées (Amharic, Tigrinya, kurde…).
Dans la période de recherche actuelle (2024-2028), FrOMi est analysé dans le cadre de 4 projets :
- 2024-2027 : Transcription du corpus FrOMi (sept. 2024-déc. 2027); financement POOL de recherche UNIFR (Ref. PO2490), 30'000 CHF; N. Dherbey Chapuis. Collaboration N. Dherbey Chapuis et S. Madikeri.
- 2024-2027 : Production de ressources pédagogiques pour les élèves allophones de 1H et 2H (sept. 2024-déc. 2027); financement Office fédéral de la culture OFC (selon OLang art.10, Ref. 95123), 193'528 CHF, N. Dherbey Chapuis. Recherche collaborative avec les enseignant·e·s des écoles du Quartier du Schoenberg, Fribourg (cofinancement OFC, SEnOF, CIIP).
- Demande de financement en attente, Influence de l’usage oral des chunks sur le développement de la grammaire en français langue seconde. Ce projet est une collaboration de N. Dherbey Chapuis et de la Prof. A. Thomas.
- 2023-2028 : Thèse de doctorat de N. Félix sous la Direction du Prof. R. Berthele.
L’objectif est de transcrire le corpus de FrOMi et de coder les productions orales spontanées enregistrées pour permettre des analyses du développement linguistique. Les analyses linguistiques devraient permettre de mieux comprendre le développement linguistique du FLS par des enfants plurilingues en immersion en français à l’école en Suisse. A partir de ces analyses, du matériel d’enseignement et des propositions didactiques seront élaborés pour proposer un enseignement du français à l’école enfantine plus adapté à leurs besoins.