Algoritma Modified K-Means Clustering pada Penentuan Cluster Centre Berbasis Sum Of Squared Error (Sse)

Nainggolan, Rena

View/Open

Fulltext (1.168Mb)

Date

2014

Author

Nainggolan, Rena

Advisor(s)

Mawengkang, Herman

Iryanto

Metadata

Show full item record

Abstract

One of techniques popular inData Mining is clustering. Defenition clustering in scientific from data miningis some of data or objectsin one group or clusters into cluster so each cluster will containthedataas closely aspossibleanddifferent objects in another cluster. Thereare twomethodsof dataclusteringis often used inthe process ofgroupingthe datathat arehierarchical(hierarchy) andnon-hierarchical clusteringof data(non-hierarchical) clusteringof data. K-Means is one method fromnon-hierarchical clusteringof data this methodmake partition data theavailable datainonecluster ormore. MethodsK-Means clustering isthe mostsimple andgeneral. This is becauseK-means have abilityto groupingdata ina fairlylargeamountwith computingtimeisrelativelyfastandefficient. ButK-means hashadweakness becausebythe determination ofinitialclustercenters. The results ofthe clusterformed byK-means clustering methodis verydependenton theinitiationvalue ofthe starting pointcluster. This leads aclusterresultsbelocaloptimalsolution. In this research willbe modifiedK-Mean Clusteringforsearchthe clustercenters in the best optimal basedSumofSquaredError(SSE). From modificationprocess, be expectedclustercenterobtainedwill be result clusters-clusters, where theevery members cluster havea highdegree ofsimilarity.

Salah satu teknik yang dikenal dalam Data Mining yaitu clustering. Pengertian clustering keilmuan dalam data mining adalah pengelompokan sejumlah data atau objek ke dalam cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya.Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu hierarchical (hirarki) data clustering dan non hierarchical (non hirarki) data clustering. K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluste/kelompok. Metode K-means merupakan metode clustering yang paling sederhana dan umum. Hal ini dikarenakan K-means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien. Namun, K-means mempunyai mempunyai kelemahan yang diakibatkan oleh penentuan pusat awal cluster. Hasil cluster yang terbentuk dari metode K-means ini sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan. Hal ini menyebabkan hasil clusternya berupa solusi yang sifatnya local optimal. Pada penelitian ini akan dilakukan modifikasi K-Mean Clustering untuk pencarian pusat cluster yang paling optimum berbasis Sum of Squared Error (SSE).Dari proses modifikasi ini, diharapkan pusat cluster yang diperoleh nantinya akan menghasilkancluster - cluster, dimana antar anggota cluster memiliki tingkat kemiripan yang tinggi.

URI

http://repositori.usu.ac.id/handle/123456789/34396

Collections

Master Theses [629]