Kajian Metode Pohon Model Logistik (Logistic Model Tree) dengan Penanganan Ketakseimbangan Data

Akmala Firdausi, Aam Alamudi, Kusman Sadik
2022 Xplore Journal of Statistics  
Logistic model tree (pohon model logistik) adalah metode pemodelan nonparametrik yang mengombinasikan metode pohon keputusan dengan regresi logistik linier. Pohon model logistik dapat menangani multikolinearitas dengan baik, tetapi tidak kebal terhadap masalah yang diakibatkan oleh ketakseimbangan data. Penelitian ini dilakukan untuk mengkaji performa metode penanganan ketakseimbangan data undersampling, SMOTE, dan ROSE pada pohon model logistik. Data yang digunakan adalah data simulasi yang
more » ... eroleh dengan membangkitkan bilangan acak berdasarkan sebaran Bernoulli sebagai peubah respon dan bilangan normal berganda dua peubah sebagai peubah penjelas. Kombinasi yang digunakan adalah tingkat ketakseimbangan data. Berdasarkan nilai AUC, diperoleh bahwa pohon model logistik yang dibangun dengan menerapkan metode penanganan ketakseimbangan data memiliki performa klasifikasi yang lebih baik dibandingkan dengan pohon model logistik yang dibangun tanpa menerapkan metode penanganan ketakseimbangan data pada seluruh tingkat ketakseimbangan yang dicobakan. Pohon model logistik dengan penerapan metode ROSE memiliki performa lebih baik dibandingkan dengan pohon model logistik dengan penerapan metode undersampling maupun SMOTE pada gugus data dengan tingkat ketakseimbangan data tinggi hingga sedang. Pada gugus data dengan tingkat ketakseimbangan data rendah, performa pohon model logistik dengan penerapan metode ROSE dan metode undersampling tidak berbeda signifikan.
doi:10.29244/xplore.v11i2.922 fatcat:4sgv5q6z7zes7d5eoegui6zgru