Análisis empírico de la dispersión del español mexicano

Orlando Ramos, David Pinto, Belem Priego, Iván Olmos, Beatriz Beltrán
2014 Research in Computing Science  
Resumen. En este artículo se presenta un sistema que pretende facilitar el análisis de la dispersión del español mexicano. Se presentan gráficas resultantes, así como los modelos del sistema. El objetivo es mostrar el avance del sistema y su posible aplicación en el cálculo de la dispersión del lenguaje para otros idiomas. Los experimentos fueron realizados sobre dos tipos de corpora: noticias y tweets. Palabras clave: Dispersión del idioma, noticias, tweets. Introducción En el idioma español
more » ... isten rasgos y características que distinguen a un pueblo de otro de una manera muy particular, ya sea el español de España en donde su pronunciación y significado varian en comparación al de Latinoamérica, especialmente al español mexicano. México es un pueblo rico en cultura y tradiciones, y esto precisamente es lo que hace, que en cada una de sus entidades federativas se encuentren frases o palabras que los distingan de una manera en particular, estas pequeñas diferencias son las que dan pie a esta investigación, para lograr identificar las regiónes de nuestro país en donde se dan estas variaciones. Como objetivo general nos hemos planteado analizar el uso del idioma español en la República Mexicana y su posible dispersión de acuerdo a la ubicación geográfica. Así, nuestros objetivos específicos son los siguientes: 1. Construir un corpus etiquetado geográficamente del español usado en la República Mexicana. 2. Estudiar diversos métodos para la identificación automática de la dispersión en el uso del lenguaje natural. 3. Construir un mecanismo de visualización para el uso del idioma, de acuerdo a la ubicación geográfica. 4. Evaluar los resultados obtenidos en base a métricas estándar tales como precisión y recall.
doi:10.13053/rcs-74-1-1 fatcat:aguvwkrtqfafnbv5stztazhwxi