Análisis de estilos de redacción para la identificación de autoría usando métodos de agrupamiento

Ariel Céspedes Pérez, Ricardo Enrique Pérez Guzmán, Daniel Eugenio Pérez Guzmán
2017 Informática y sistemas  
Internet es hoy un espacio muy dinámico y revolucionador. Sus consumidores se han convertido en productores de la información que ellos mismos consumen, apoyados en herramientas y plataformas instaladas en grandes servidores, que facilitan el uso y la publicación de contenidos. Si bien este proceso ha democratizado el acceso de muchos a la información, también ha provocado una excesiva socialización de la propiedad intelectual y científica, pues los materiales se publican muchas veces bajo
more » ... cias que permiten su descarga sin el consentimiento del creador. En este contexto muchas veces se hace necesario determinar el autor de un documento anónimo, o uno cuyo autor esté en duda. Para realizar el análisis de autoría, como se le conoce a esta tarea, es necesario inferir características del autor a través de los documentos escritos por él y luego conformar un modelo de su estilo que pueda ser comparable con el de otra persona. Sin embargo resulta impráctico realizar el procesamiento de todos los posibles autores que existen a partir de sus publicaciones. Por ello es necesario determinar procedimientos que sin utilizar un conjunto de archivos de referencia, realicen un análisis del estilo en el texto y revelen sus variaciones estilográficas. En este trabajo se expone un procedimiento para lograr este propósito aplicando métodos de agrupamiento al documento que se desea analizar. Los resultados de los experimentos con determinados métodos de este tipo y varios rasgos lingüísticos, muestran que usando el algoritmo sIB en textos caracterizados por tri-gramas de caracteres y uni-gramas de palabras, se obtienen resultados aceptables.
doi:10.33936/isrtic.v1i2.839 fatcat:b5dn5ea245bshp74cqunmwpgla