Komparasi Performa Fuzzy C-Means dan Random Forest (Studi Kasus: Indeks Modal Sosial Indonesia)

Authors

  • Pardomuan Robinson Sihombing BPS-Statistics Indonesia
  • Ade Marsinta Arsani BPS-Statistics Indonesia
  • Wisnu Pratiko BPS-Statistics Indonesia
  • Sri Murtiningsih BPS-Statistics Indonesia

DOI:

https://doi.org/10.55606/khatulistiwa.v3i1.982

Keywords:

3 Fuzzy C-Means, Klaster, Modal Sosial Random Forest, Silouhette

Abstract

Penelitian ini bertujuan menguji performa metode Fuzzy C-Means Klaster dengan Random Forest Clustering. Data yang digunakan data dimensi Indeks Modal Sosial di 34 Provinsi di Indonesia tahun 2021. Indeks mdoal social terdiri atas tiga dimensi yaitu dimensi Rasa Percaya, Partisipasi Sosial dan Toleransi. Data bersumber dari Badan Pusat Statistik (BPS). Banyaknya klaster optimum yang disarankan dengan menggunakan teknik metode Elbow adalah sebanyak 3 klaster. Dengan memperhatikan nilai Silouhette dan R square terbesar metode random forest lebih baiknya daripada Fuzzi C-Means. Hal senada jika dilihat berdasarkan kriteria nilai AIC dan BIC yang lebih kecil model random forest lebih baik daripada fuzzy c-means. Klaster 3 merupakan klaster dengan nilai dimensi terbaik dimana nilainya semuanya di positif atau di atas rata-rata. Di sisi lain klaster 1 merupakan provinsi dengan nilai dimensi terburuk karena semua nilai dimensinya negative, di bawah rata-rata data. Dibutuhkan kebijakan yang komprehensif dan tepat sasaran sehingga indeks modal social di Indonesia dapat merata dan meningkat setiap tahunnya.

References

Akaike, H. (1974). A New Look at the Statistical Model Identification. IEEE Transactions on Automatic Control, 19(6), 716–723. https://doi.org/10.1109/TAC.1974.1100705

Alzubaidi, L., Arkah, Z. M., & Hasan, R. I. (2018). Using random forest algorithm for clustering. Journal of Engineering and Applied Sciences, 13(21), 9189–9193. https://doi.org/10.3923/jeasci.2018.9189.9193

BPS. (2022). Statistik Modal Sosial 2021.

Fukuyama, F. (1995). Trust: The Social Virtues and the Creation of Prosperity. Free Press.

Gideon Schwarz. (1978). Estimating The Dimension of a Model. The Annals of Statistics, 6(2), 461–464.

Gujarati, D. (2004). Basic Econometrics BY Gujarati (pp. 1–1002). McGraw-Hill Inc.

Madhulatha, T. . (2012). An Overview On Clustering Methods. IOSR Journal Engineering, 2(4), 719–725.

Mas’udin, P. E., Farida, A., & Mustafa, L. D. (2018). ClusteringData RemunerasiDosen Untuk Penilaian Kinerja Menggunakan Fuzzy c-Means. Jurnal Resti, 288–294.

Sokoutia, B., Rezvanb, F., & Dastmalchi, S. (2015). Applying random forest and subtractive fuzzy c-means clustering techniques for developing a novel G protein-coupled receptors discrimination method using pseudo amino acid composition. Molecular BioSystems, 3, 2–11. https://doi.org/10.1039/b000000x

Struyf, A., Hubert, M., & P. J. Rousseeuw. (1997). Clustering in an Object-Oriented Environment. Journal of Statictical Software, 1(4), 1–30.

Widarjono, A. (2007). Ekonometrika: Teori dan Aplikasi untuk Ekonomi dan Bisnis. Ekonosia Fakultas Ekonomi Universitas Islam Indonesia.

Yu, J., Zhu, L., Qin, R., Zhang, Z., Li, L., & Huang, T. (2021). Combining k-means clustering and random forest to evaluate the gas content of coalbed bed methane reservoirs. Geofluids, 2021. https://doi.org/10.1155/2021/932156

Downloads

Published

2023-01-17

How to Cite

Pardomuan Robinson Sihombing, Ade Marsinta Arsani, Wisnu Pratiko, & Sri Murtiningsih. (2023). Komparasi Performa Fuzzy C-Means dan Random Forest (Studi Kasus: Indeks Modal Sosial Indonesia). Khatulistiwa: Jurnal Pendidikan Dan Sosial Humaniora, 3(1), 142–150. https://doi.org/10.55606/khatulistiwa.v3i1.982