On Strategies of Human Multi-Document Summarization

Renata T. Camargo, Ariani Di Felippo, Thiago A. S. Pardo
2015 Brazilian Symposium in Information and Human Language Technology  
In this paper, using a corpus with manual alignments of humanwritten summaries and their source news, we show that such summaries consist of information that has specific linguistic features, revealing human content selection strategies, and that these strategies produce indicative results that are competitive with a state of the art system for Portuguese. Resumo. Neste artigo, a partir de um corpus com alinhamentos manuais entre sumários e suas respectivas notícias-fonte, evidencia-se que tais
more » ... sumários são compostos por informações que possuem características linguísticas específicas, revelando estratégias humanas de sumarização, e que essas estratégias produzem resultados iniciais que são competitivos com um sistema do estado da arte para o português.
dblp:conf/stil/CamargoFP15 fatcat:xfgz4gb3cvdh7i566vwwzvakva