Data clustering adalah suatu metode pemecahan masalah dengan memodelkan suatu bentuk masalah ke dalam model matematika dengan mencari bentuk (structure) menggunakan persamaan sifat yang ada pada data tersebut. Proses terpenting dalam data clustering ini adalah melihat persamaan yang terdapat pada data, sehingga data dapat digolongkan ke dalam kelas-kelas (clusters) yang telah ditentukan sebelumnya.
Cara kerja dari data clustering adalah mengkoordinasikan data-data yang ada kedalam beberapa kelas, yang anggota dari kelas tersebut memiliki kesamaan dalam hal-hal tertentu. Pada proses clustering, seseorang tidak memerlukan kelas atau kelompok yang harus didefiniskan sebelumnya, karena clustering dinyatakan sebagai bentuk pembelajaran berdasarkan observasi bukan berdasarkan contoh. Kelas-kelas yang terbentuk pada proses clustering akan muncul ketika data-data sudah ada. Berbeda dengan clustering, pada classification memiliki tujuan untuk mengklasifikasikan suatu data akan masuk dalam kelompok atau kelas yang sudah ada, sehingga dalam classification tidak akan terjadi pertambahan kelompok karena data-data tersebut sudah jelas akan masuk ke kelas-kelas yang sudah ditentukan. Oleh karena itu classification termasuk dalam kelompok supervised clustering
Data clustering yang secara umum digunakan untuk pengolahan data matematis adalah distance-based clustering, karena clustering jenis ini dilakukan secara matematis dan fuzzy clustering termasuk didalamnya.
sumber:
haduh lupa dari mana ni cimutz kutip, tp yang jelas materi ini cimutz kutip dari jurnal bebas salah satu univ d indonesia tentunya..
