MODAL: A multilingual corpus annotated for modality [chapter]

Malvina Nissim, Paola Pietrandrea
Proceedings of the Fourth Italian Conference on Computational Linguistics CLiC-it 2017  
English. We have produced a corpus annotated for modality which amounts to approximately 20,000 words in English, French, and Italian. The annotation scheme is based on the notion of epistemic construction and virtually languageindependent. The annotation is rigorously evaluated by means of a newly developed strategy based on the alignment of the entire epistemic constructions as identified and marked up two annotators. The corpus and the agreement scoring tools are publicly available.
more » ... Presentiamo un corpus multilingue di circa 20,000 parole annotato per modalità epistemica. La procedura di annotazioneè guidata dal concetto di costruzione epistemic. La validità dell'annotazioneè valutata attraverso una strategia sviluppata per tenere conto della necessità di allineare intere costruzioni identificate da annotatori diversi. Il corpus e gli strumenti per la valutazione dell'annotazione sono resi disponibili.
doi:10.4000/books.aaccademia.2435 fatcat:t7yf5vt4bfgcvks6ehvqg53x7y