expr:class='"loading" + data:blog.mobileClass'>

Minggu, 07 Oktober 2018

Bedah Jurnal 2



Kita Langsung masuk ke pembahasan selanjutnya, yaitu:


4. DATA DATA YANG DIGUNAKAN

Ada 3 data yang di ambil dalam proses pemetaan ini yaitu data Murid dan Guru SD,SMP dan SMA di Provinsi Banten.




Dalam Sistem Informasi Geografis dapat diuraikan menjadi beberapa subsistem sebagai berikut: 
a. Data Input 
Data input pada sistem adalah: data jumlah guru, jumlah sekolah, jumlah murid pada tingkat SD, SMP dan SMA di Provinsi Banten serta peta Provinsi Banten. 
b. Data Output 
Subsistem output atau luaran sistem untuk menyajikan informasi seperti peta Provinsi Banten, tabel hasil clustering K-Means dan analisis cluster. 
c. Data Management 
Data management pada sistem bertugas untuk mengorganisasikan baik data spasial maupun tabel ke dalam sebuah basis data sehingga data dapat dengan mudah dikelompokan menggunakan metode K-Means. 
d. Data Manipulation 
Data manipulation pada sistem bertugas dalam menentukan informasi-informasi yang dapat dihasilkan oleh Sistem Informasi Geografis dan pemodelan untuk menghasilkan informasi yang diharapkan.

5. METODE YANG DIGUNAKAN UNTUK PENGOLAHAN DATA

Dalam kasus ini,Pemetaan guru di Provinsi Banten,data jumlah guru,data jumlah murid dan data jumlah sekolah dikelompokkan menggunakan metode clustering K-Means.
Langkah-langkah dalam melakukan algoritma KMeans: 
1. Menentukan banyak cluster 
Menentukan banyak cluster sesuai dengan masalah yang diteliti untuk mempermudah mengelompokkan data yang memiliki karakter sejenis. 
2. Menentukan titik pusat 
Selanjutnya menentukan titik pusat (centroid) dari tiap-tiap cluster. Pengambilan titik pusat secara random (acak). 
3. Menghitung jarak setiap objek ke titik pusat  
Kemudian menghitung jarak setiap data dengan titik pusat yang sudah ditentukan sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah:  

๐‘‘(๐‘ฅ,๐‘ฆ) = √(๐‘ฅ1 − ๐‘ฆ1)2 + (๐‘ฅ2 − ๐‘ฆ2)2 + ⋯+ (๐‘ฅ๐‘ − ๐‘ฆ๐‘)2

4. Mengelompokkan objek berdasarkan jarak terdekat 
Mengelompokkan objek berdasarkan jarak terdekat / minimum antara data dengan titik pusat. 
5. Lakukan iterasi
kemudian tentukan posisi centroid baru dengan menggunakan persamaan sebagai berikut:

 ๐œ‡ = ∑ ๐‘ฅ๐‘– ๐‘› ๐‘–=1 ๐‘› ;๐‘– = 1,2,3,…๐‘› 

Dimana: 
ยต = titik pusat / centroid pada cluster 
๐‘ฅ๐‘– = objek ke-i 
n = banyaknya objek / jumlah objek yang menjadi anggota cluster 

Jika pusat cluster tidak berubah lagi maka proses clustering selesai, atau kembali ke langkah nomor 3 sampai pusat cluster tidak berubah lagi.

Tidak ada komentar:

Posting Komentar

Classification,Regression dan Clustering

Pada kesempatan  kali ini kita akan mencoba mengolah data menggunakan 3 metode yaitu : 1. Classification (Predictive) 2. Regressio...