Minería de datos aplicada a la detección de cáncer gástrico

Omar D. Castrillón, Luis F. Castillo, Carlos E. Castaño
2022 Información Tecnológica  
En este estudio se busca determinar las variables que influyen en la aparición de neoplasia e identificar oportunamente la población susceptible a desarrollar cáncer gástrico. Se utiliza la plataforma Weka con el algoritmo de clasificación J48. Inicialmente se modela una base de datos con 172 registros sociodemográficos y genéticos, de construcción propia, con 11 variables independientes (edad, genero, estrato, raza, comida ultra procesada, antecedentes familiares, Helicobacter pylori,
more » ... o, consumo de licor, polimorfismos GSTM1 null, GSTT1 null) y una variable dependiente, cáncer gástrico con 3 estados (ninguno, tipo intestinal y tipo difuso). Se seleccionan las variables independientes con mayor influencia sobre la variable dependiente. Se logra un porcentaje de éxito superior al 91%, en la identificación de la variable dependiente. En conclusión, la técnica de minería de datos empleada (árboles de decisión) permite establecer que hay diferentes variables que influyen en la aparición del cáncer gástrico.
doi:10.4067/s0718-07642022000400151 fatcat:jbe34jduuzbljou65rnorqfw74