Método de detección de paráfrasis para el idioma inglés (Paraphrase detection method for English language)

Feus, Yusdanis; Guerrero, Leodanys; Pompa, Saylin
2017 Zenodo  
La detección de paráfrasis se usa comúnmente en diversas áreas de investigación relacionadas con el procesamiento del lenguaje natural, tales como la recuperación de información, traducción automática, generación de resúmenes, identificación de plagio en textos y búsqueda de respuestas. El objetivo de los métodos de detección de paráfrasis es decidir si dos oraciones tienen el mismo significado. Este artículo presenta un método basado en aprendizaje automático supervisado para la detección de
more » ... ráfrasis, el cual usa información léxica y semántica. Con el fin de identificar paráfrasis se usan tres clasificadores de aprendizaje automático: máquinas de vectores de soporte, k-vecinos más cercanos y árboles de decisión. En la evaluación empírica se examina el poder de discriminación de los conjuntos de atributos léxicos y semánticos de forma separada. Además, se estudia el comportamiento de los tres clasificadores con la combinación de los atributos léxicos y semánticos en un solo conjunto. Se utilizó el conjunto de datos Microsoft Research Paraphrase Corpus para la evaluación empírica y se comparó el método propuesto con los acercamientos similares. Los experimentos mostraron que el clasificador máquina de vectores de soporte alcanzó el mayor rendimiento con la combinación del conjunto de atributos léxicos.
doi:10.5281/zenodo.2617315 fatcat:vjajgehgvvaixosjw3yk2ocw5i