Filters








1 Hit in 0.043 sec

Établir un corpus oral de questions : L'analyse semi-automatisée avec Praat et Perl à l'exemple de cinq épisodes deMaya l'Abeille

Janina Reinhardt, F. Neveu, G. Bergounioux, M.-H. Côté, J.-M. Fournier, L. Hriba, S. Prévost
2016 SHS Web of Conferences  
Cette communication donne des directives pour la sélection des textes ainsi que des propositions concernant l'usage des outils Praat et Perl, puis les applique à un exemple. À l'heure actuelle, le traitement par ordinateur devient de plus en plus important pour l'analyse des corpus. Cependant, l'exploitation de données prêtes à l'usage nous fait parfois oublier qu'un corpus doit tout d'abord être composé de manière adéquate. De plus, l'automatisation peut être très utile, mais il est impératif
more » ... s il est impératif de l'utiliser uniquement pour ce qui est décidable par les ordinateurs. Par conséquent, la contribution de cet article est une annotation manuelle par Praat, joint à l'application d'un script de Perl exécutant la partie automatisable. Cet article a trois objectifs : supporter et améliorer les recherches s'appuyant sur des corpus, développer une méthodologie pour établir et analyser un corpus de questions parlées, et enfin d'exemplifier une telle procédure à l'aide d'un petit corpus, à savoir cinq épisodes de l'émission télévisée Maya l'Abeille. Dans ce dernier, je démontre que les patrons intonatifs ne peuvent pas être associés directement aux structures morphosyntaxiques. De surcroît, les résultats soutiennent l'idée que la variation morphosyntaxique ne peut pas être expliquée par une seule catégorie de variables (intralinguistiques, extralinguistiques ou discursifs) mais par l'ensemble des facteurs appartenant à ces trois catégories. Abstract. Building an oral corpus of questions. This article sheds light upon the question of how to build and analyse an oral corpus of questions. To this end, it provides directives for the selection of texts, makes suggestions for the usage of the tools Praat and Perl, and applies them to an example. At present, computer processing is becoming increasingly important for the analysis of corpora. However, tempted by the huge amount of data offered by the internet, researchers sometimes forget that a corpus has to be composed in an adequate way. Also, it is imperative that automation is only used for decisions which can be made correctly by computers. Consequently, this article proposes an analysis in two-steps: first, a manual annotation with Praat, and second, the application of a Perl script to execute the automatable part. This article has three goals: the support and improvement of corpus-based researches, the development of a methodology to establish and analyse a corpus of spoken questions, and the exemplification of such a procedure through its application to a corpus of five episodes of the TV series Maya l'Abeille. In the latter, I show that intonational patterns cannot be mapped to morphosyntactic structures. What is more, I give support to the notion that morphosyntactic variation should a janina.reinhardt@uni-konstanz.de , not be reduced to either language-internal, sociolinguistic, or pragmatic factors, but is best described by incorporating all of these factors.
doi:10.1051/shsconf/20162711007 fatcat:dzxl7zvhkrbvfhvhtxmwiba77m