Modelos Gráficos Probabilísticos Aplicados al Análisis Espacial en R: Hurtos de Celulares en Bogotá
Danna Lesley Cruz Reyes
2020
TECCIENCIA
Resumen. Los avances tecnológicos recientes permiten la recopilación, el procesamiento y el almacenamiento de información a gran escala. Esto ha determinado el comienzo del big data, donde el aumento de la información ha dado lugar a conjuntos de datos grandes y complejos que pueden ser potencialmente explotados para encontrar soluciones a problemas relevantes. Este trabajo tiene como objetivo explicar cómo los métodos estadísticos pueden analizar estos conjuntos de datos grandes y complejos,
more »
... pecíficamente datos espaciales. Se realiza un análisis de dependencia espacial por medio de la un grafo que caracteriza la estructura espacial y un modelo ampliamente utilizado conocidos como autorregresivo condicionales (CAR por sus siglas en ingles). Estos modelos son útiles para obtener distribuciones conjuntas multivariadas de un vector aleatorio basado en especificaciones condicionales univariadas. Estas especificaciones condicionales se basan en las propiedades de Markov, de modo que la distribución condicional de un componente del vector aleatorio depende solo de un conjunto de vecinos, definido por el grafo. Los modelos autorregresivos condicionales son casos particulares de campos aleatorios de Markov. Finalmente, se explica como realizar estos análisis en R, incluyendo el manejo de grafos y los paquetes utilizados. Se realiza la estimación de los parámetros en R siguiendo la metodología bayesiana a un conjunto de datos que corresponde al robo de celulares en Bogotá. Abstract Recent technological advances allow large-scale collection, storage and processing information. As a consequence textbf big data has become more important nowadays, since the increase in information has given rise to large and complex data sets that can be potentially exploited to find solutions to relevant problems. This work aims to explain how statistical methods can analyze these large and complex data sets, specifically spatial data. A spatial dependency analysis is carried out by means of a graph that characterizes the spatial structure and a widely used approach known as Conditional Auto-Regressive (CAR). These models are useful for obtaining multivariate joint distributions of a random vector based on uni-variate conditional specifications. These conditional specifications are based on the Markov properties. Hence, that the conditional distribution of a component of the random vector depends only on a set of neighbors defined by the graph. CAR models are particular cases of random Markov fields. Finally, it is explained how to carry out these analyzes in R language programming including the handling of graphs and the packages used. Finally, the parameters estimation in R is carried out following the Bayesian methodology to data corresponding to stolen cell phones in Bogotá-Colombia.
doi:10.18180/tecciencia.2020.29.2
fatcat:2p5fbrcm7zhzbe2rtbnlndvuru