Opportunités et limites en stylistique computationnelle de la poésie : Détection automatique de l'enjambement en anglais

Eulalie Monget, Pablo Ruiz Fabo
2020 Zenodo  
Comment opérationnaliser des concepts d'analyse littéraire sur la base d'annotations issues des outils de Traitement automatique des langues (TAL), originalement conçues pour une analyse non-littéraire ? Comment évaluer nos annotations automatiques d'un trait stylistique, en termes de, et au-delà de, la comparaison avec des données de référence annotées manuellement ? Quel gain de connaissance spécifique à l'analyse littéraire est atteignable à travers l'annotation stylistique automatique, qui
more » ... e automatique, qui serait impossible sans traitement informatique ? C'est des questions qui nous occupent dans notre projet sur la détection automatique de l'enjambement dans la poésie en anglais. L'enjambement implique une discordance entre les pauses requises par la structure métrique (fins de vers ou hémistiche) et des pauses demandées par la syntaxe ou le sens (cf. Golomb, 1979, p. 269). Hors cette caractérisation générale, la définition de l'enjambement ne fait pas consensus (cf. Quilis, 1964 ; Hollander, 1975 ; Golomb, 1979 ; Hussein et al., 2018 ; Delente, 2019). C'est une raison pour développer des logiciels qui implémentent les différentes définitions possibles : en détectant automatiquement leurs occurrences sur un grand corpus, les atouts et limites de chaque définition pourront être examinés au vue d'un exemplier large. Pour l'évaluation, nous avons annoté manuellement l'enjambement, selon notre définition, dans 60 poèmes de genres variés des 19e et 20e siècles (voir https://git.unistra.fr/enj/corpus-reference).
doi:10.5281/zenodo.3788108 fatcat:hn5nwjraabflrloq262ewmamdy