PENGELOMPOKAN PROVINSI MEROKOK DI INDONESIA BERDASARKAN IPM MENGGUNAKAN K-MEANS DAN KNN
DOI:
https://doi.org/10.62281/v3i7.2639Keywords:
Data Mining, K-Means, Clustering, K-Nearest Neighbor, IPM, HDIAbstract
Salah satu kendala dalam pembangunan kesehatan nasional adalah prevalensi perokok di Indonesia, termasuk di kelompok usia produktif. Tujuan dari penelitian ini adalah untuk mengelompokkan dan mengklasifikasikan provinsi-provinsi di Indonesia berdasarkan persentase penduduk usia 15 tahun ke atas yang merokok serta nilai Indeks Pembangunan Manusia (IPM) pada tahun 2024. Studi ini menggunakan K-Means Clustering untuk mengelompokkan provinsi ke dalam klaster risiko, dan K-Nearest Neighbor (KNN) digunakan untuk mengelompokkan provinsi ke dalam klaster risiko berdasarkan nilai IPM terhadap klaster hasil K-Means. Badan Pusat Statistik (BPS) dan Sistem Informasi Manajemen Data Regional (SIMREG-Bappenas) menyediakan data. Hasil pengelompokan menunjukkan bahwa terdapat tiga klaster utama yang berbeda dalam hal tingkat merokok dan IPM. Model KNN digunakan untuk memprediksi klaster berdasarkan nilai IPM, dan menghasilkan tingkat akurasi klasifikasi yang tinggi, yang menunjukkan bahwa IPM memiliki keterkaitan terhadap pola persebaran kebiasaan merokok di tingkat provinsi. Penelitian ini memberikan kontribusi dalam pemetaan wilayah dengan risiko perilaku merokok tinggi, serta dapat menjadi dasar dalam penyusunan kebijakan kesehatan berbasis data di tingkat regional.
Downloads
References
B. G. Sudarsono, M. I. Leo, A. Santoso, and F. Hendrawan.(2021). “ANALISIS DATA MINING DATA NETFLIX MENGGUNAKAN APLIKASI RAPID MINER,” JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 1, doi: 10.30813/jbase.v4i1.2729.
D. Zamri.(2022). “Comparison of Data Mining Methods for Predition of Floods with Naïve Bayes and KNN Algorithm”.
E. Harlan.(2023). “Bagaimana Konsumsi Tembakau, IPM, Ketimpangan, Pendapatan dan Pengangguran Mempengaruhi Kemiskinan di Lampung?,” Tirtayasa Ekon., vol. 18, no. 2, p. 22, doi: 10.35448/jte.v18i2.22007.
F. Almaidah et al.(2020). “SURVEI FAKTOR PENYEBAB PEROKOK REMAJA MEMPERTAHANKAN PERILAKU MEROKOK,” J. Farm. Komunitas, vol. 8, no. 1, p. 20, doi: 10.20473/jfk.v8i1.21931.
L. S. Hasibuan.(2020). “ANALISIS DETERMINAN INDEKS PEMBANGUNAN MANUSIA (IPM) DI INDONESIA,” vol. 5, no. 2.
M. H. Setiyani and S. Kristiyanto.(2024). “ROKOK, KEBIASAAN MEROKOK DAN ANGKA KEMISKINAN DI PULAU JAWA,” OIKOS J. Kaji. Pendidik. Ekon. Dan Ilmu Ekon., vol. 8, no. 1, doi: 10.23969/oikos.v8i1.12534.
M. Rafi Nahjan, Nono Heryana, and Apriade Voutama.(2023). “IMPLEMENTASI RAPIDMINER DENGAN METODE CLUSTERING K-MEANS UNTUK ANALISA PENJUALAN PADA TOKO OJ CELL,” JATI J. Mhs. Tek. Inform., vol. 7, no. 1, pp. 101–104, doi: 10.36040/jati.v7i1.6094.
N. Purwati, H. Kurniawan, and S. Karnila.(2021). Data mining, vol. 1. Zahira Media Publisher. Accessed: Jul. 20, 2025. [Online]. Available: https://books.google.com/books?hl=id&lr=&id=Q3NHEAAAQBAJ&oi=fnd&pg=PR5&dq=apa+itu+data+mining&ots=cN4aTPpHM2&sig=j8DGIt1mIDLSEcosD7DkyBeQjKg.
S. Zulaikhah Hariyanti Rukmana, A. Aziz, and W. Harianto.(2022) “OPTIMASI ALGORITMA K-NEAREST NEIGHBOR (KNN) DENGAN NORMALISASI DAN SELEKSI FITUR UNTUK KLASIFIKASI PENYAKIT LIVER,” JATI J. Mhs. Tek. Inform., vol. 6, no. 2, pp. 439–445, doi: 10.36040/jati.v6i2.4722.
Suharmanto, W. S. Utami, N. Pratiwi, and F. Muhammad.(2023). “Penerapan Data Mining Menggunakan Algoritma K-Means Untuk Clustering Perokok Usia Lebih dari 15 Tahun,” Bull. Inf. Technol. BIT, vol. 4, no. 4, pp. 501–507, doi: 10.47065/bit.v4i4.1067.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Baihaqi Asa’ari Lubis, Indry Widiyani, Elkin Rilvani (Author)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.









