The Mwan language: dictionary and corpus of texts

Elena Perekhvalskaya
2014 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Le projet d'un dictionnaire et un corpus de textes glosés en langue mwan a démarré en 2004. Auparavant, aucun dictionnaire de cette langue n'avait existé, et seuls quelque textes avaient été publiés. Le système d'écriture utilisé dans ces publications a été non-systématique car elle n'assurait pas la représentation exacte du contour tonal de mots. Actuellement le dictionnaire mwan a 2247 entrées, il est également utilisé pour interlinearization automatique de textes mwan. 48 textes sont glosés
more » ... ce moment (38000 mots). Ce corpus est prêt à la conversion en corpus numerique en ligne (à la base de NoSketchEngine software), et publiée en Internet ; ils seront donc disponibles à la communauté linguistique.
dblp:conf/taln/Perekhvalskaya14 fatcat:e5ifn6t545c4bcrfz22sna2oue