Modeling Data Mining Applications for Prediction of Prepaid Churn in Telecommunication Services

Goran Kraljević, Sven Gotovac
2010 Automatika  
This paper defines an advanced methodology for modeling applications based on Data Mining methods that represents a logical framework for development of Data Mining applications. Methodology suggested here for Data Mining modeling process has been applied and tested through Data Mining applications for predicting Prepaid users churn in the telecom industry. The main emphasis of this paper is defining of a successful model for prediction of potential Prepaid churners, in which the most important
more » ... the most important part is to identify the very set of input variables that are high enough to make the prediction model precise and reliable. Several models have been created and compared on the basis of different Data Mining methods and algorithms (neural networks, decision trees, logistic regression). For the modeling examples we used WEKA analysis tool. Modeliranje Data Mining aplikacija za detekciju churna Prepaid korisnika telekomunikacijskih usluga. U radu je definirana unaprijeena metodologija za proces modeliranja aplikacija zasnovanih na metodama dubinske analiza podataka (Data Mining), koja predstavlja logički okvir (framework) za razvoj različitih Data Mining aplikacija. Predložena metodologija je primjenjena na primjeru Data Mining aplikacije za detekciju churna Prepaid korisnika telekomunikacijskih usluga. Glavno težište ovog rada je na definiranju uspješnog modela za predvianje potencijalnih Prepaid churn-era. Najvažniji dio izgradnje modela je definiranje onog skupa ulaznih varijabli koje su u toj mjeri snažne da model predvianja bude točan i pouzdan. Kroz navedeni primjer je kreirano i usporeeno više modela zasnovanih na različitim Data Mining metodama i algoritmima (neuronske mreže, stabla odlučivanja, logistička regresija). Za primjere modeliranja korišten je analitički alat WEKA. Ključne riječi: aplikacije dubinske analize podataka, prepaid churn model, neuronske mreže, stabla odlučivanja, logistička regresija
doi:10.1080/00051144.2010.11828381 fatcat:b3zxt2zd6ja3jac5ta2pop6igi