Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu

Andrea Tri Rian Dani, Sri Wahyuningsih, Nanda Arista Rizki

Abstract


Analisis cluster merupakan seperangkat metode yang digunakan untuk mengelompokkan
objek ke dalam sebuah cluster berdasarkan informasi yang ditemukan pada data. Analisis
cluster dapat diterapkan pada data runtun waktu, di mana terdapat prosedur dan algoritma
pengelompokkan yang berbeda dibandingkan dengan pengelompokkan data cross-section.
Banyak teknik pengelompokkan data runtun waktu yang dikembangkan di antaranya adalah
penggunaan jarak pengukuran kemiripan yang sesuai dengan karakteristik data runtun
waktu, pemilihan algoritma pengelompokkan yang optimal sampai dengan penentuan
banyaknya cluster yang representatif. Tujuan dari penelitian adalah untuk memperoleh jarak
pengukuran kemiripan terbaik, kemudian memperoleh algoritma pengelompokkan metode
agglomerative yang optimal serta memperoleh jumlah cluster yang representatif. Pemilihan
jarak pengukuran kemiripan terbaik dan algoritma yang optimal menggunakan koefisien
korelasi cophenetic, sedangkan untuk penentuan jumlah cluster menggunakan koefisien
silhouette. Data pada penelitian adalah data jumlah penduduk Kabupaten/Kota di Provinsi
Kalimantan Timur dari Tahun 2005-2017. Berdasarkan hasil analisis, diperoleh jarak
pengukuran kemiripan terbaik dalam mengelompokkan Kabupaten/Kota di Provinsi
Kalimantan Timur adalah jarak autocorrelation based distance (ACF) dengan nilai koefisien
korelasi cophenetic sebesar 0,99. Algoritma pengelompokkan yang optimal adalah algoritma
average linkage, dikarenakan memiliki nilai koefisien korelasi cophenetic yang terbesar diantara
algoritma pengelompokkan lainnya, dengan jumlah cluster yang representatif berdasarkan
koefisien silhouette adalah 2 cluster.

Keywords


Autocorrelation based distance (ACF); Cluster; Koefisien korelasi cophenetic; Koefisien silhouette

References


Haryati, S., Sudarsono, A., & Suryana, E., 2015, Implementasi Data Mining untuk Memprediksi Masa Studi Menggunakan Algoritma C4.5, Jurnal Media Infotama 11 (2): 130-138.

Prasetyo, E., 2012, Data Mining: Konsep dan Aplikasi Menggunakan MATLAB, Yogyakarta: Penerbit Andi.

Liao, T. W., 2005, Clustering of Time Series Data Survey, Pattern Recognition 38: 1857-1874.

Virgiawan, D. M. & Mukhlash, I., 2013, Aplikasi Association Rule Data Mining untuk Menemukan Pola Data Nilai Mahasiswa Matematika ITS, Jurnal Sains dan Seni ITS 1 (1): 1-6.

Mabrur, A. G. & Lubis, R., 2012, Penerapan Data Mining untuk Memprediksi Kriteria Nasabah Kredit, Jurnal Komputer dan Informatika 1 (1): 53-57.

Santosa, B., 2007, Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis, Teori dan Aplikasi, Yogyakarta: Graha Ilmu.

Supranto, 2010, Statistik: Teori dan Aplikasi Edisi 8, Jakarta: Erlangga.

Sartono, B., Affendi, F. M., Sumertajaya, I. M. & Angraeni, Y, 2003, Analisis Peubah Ganda, Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam IPB.

Montero, P. & Vilar, J. A., 2014, TSclust: An R Package for Time Series Clustering, Journal of Statistical Software 62 (1): 01-43.

Riyadi, M. A. A., Fithriasari, K. & Dwiatmono, 2016, Data Mining Peramalan Konsumsi Listrik dengan Pendekatan Cluster Time Series sebagai Preprocessing, Jurnal Sains dan Seni ITS 5 (1): 121-126.

Johnson, R. A. & Wichern, D. W., 2002, Applied Multivariate Statistical Analysis, Fifth Edition, New Jersey: Pearson Prentice Inc.

Minitab Methods and Formulas, (Mei 12, 2019), Citing Internet sources URL https://support.minitab.com

Saracli, S., Dogan, N. & Dogan, I., 2013, Comparison of Hierarchical Cluster Analysis Methods by Cophenetic Correlation, Journal of Inequalities and Applications, doi: 10.1186/1029-242X-2013-203.

Kaufman, L. & Rousseeuw, P. J., 1990, Finding Groups in Data An Introduction to Cluster Analysis, New Jersey: John Wiley & Sons Inc Publication.

BAPPEDA Provinsi Kalimantan Timur, (Mei 12, 2019), Citing Internet sources URL

www.bappedakaltim.com

BPS Provinsi Kalimantan Timur, (Mei 05, 2019), Citing Internet sources URL www.kaltim.bps.go.id




DOI: https://doi.org/10.34312/jjom.v1i2.2354

Copyright (c) 2019 Jambura Journal of Mathematics





                         EDITORIAL OFFICE OF JAMBURA JOURNAL OF MATHEMATICS

 Department of Mathematics, Universitas Negeri Gorontalo
Jl. Jenderal Sudirman No.6, Kota Gorontalo, Provinsi Gorontalo 96128, Indonesia
 Email: info.jjom@ung.ac.id
 +62-852-55230451 (Call/SMS/WA)
 Jambura Journal of Mathematics (p-ISSN: 2654-5616 | e-ISSN: 2656-1344) by Department of Mathematics Universitas Negeri Gorontalo is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.  Powered by Public Knowledge Project OJS.