Kita Langsung masuk ke pembahasan selanjutnya, yaitu:
4. DATA DATA YANG DIGUNAKAN
Ada 3 data yang di ambil dalam proses pemetaan ini yaitu data Murid dan Guru SD,SMP dan SMA di Provinsi Banten.
Dalam Sistem Informasi Geografis dapat diuraikan menjadi beberapa subsistem sebagai berikut:
a. Data Input
Data input pada sistem adalah: data jumlah guru, jumlah sekolah, jumlah murid pada tingkat SD, SMP dan SMA di Provinsi Banten serta peta Provinsi Banten.
b. Data Output
Subsistem output atau luaran sistem untuk menyajikan informasi seperti peta Provinsi Banten, tabel hasil clustering K-Means dan analisis cluster.
c. Data Management
Data management pada sistem bertugas untuk mengorganisasikan baik data spasial maupun tabel ke dalam sebuah basis data sehingga data dapat dengan mudah dikelompokan menggunakan metode K-Means.
d. Data Manipulation
Data manipulation pada sistem bertugas dalam menentukan informasi-informasi yang dapat dihasilkan oleh Sistem Informasi Geografis dan pemodelan untuk menghasilkan informasi yang diharapkan.
5. METODE YANG DIGUNAKAN UNTUK PENGOLAHAN DATA
Dalam kasus ini,Pemetaan guru di Provinsi Banten,data jumlah guru,data jumlah murid dan data jumlah sekolah dikelompokkan menggunakan metode clustering K-Means.
Langkah-langkah dalam melakukan algoritma KMeans:
1. Menentukan banyak cluster
Menentukan banyak cluster sesuai dengan masalah yang diteliti untuk mempermudah mengelompokkan data yang memiliki karakter sejenis.
2. Menentukan titik pusat
Selanjutnya menentukan titik pusat (centroid) dari tiap-tiap cluster. Pengambilan titik pusat secara random (acak).
3. Menghitung jarak setiap objek ke titik pusat
Kemudian menghitung jarak setiap data dengan titik pusat yang sudah ditentukan sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah:
๐(๐ฅ,๐ฆ) = √(๐ฅ1 − ๐ฆ1)2 + (๐ฅ2 − ๐ฆ2)2 + ⋯+ (๐ฅ๐ − ๐ฆ๐)2
4. Mengelompokkan objek berdasarkan jarak terdekat
Mengelompokkan objek berdasarkan jarak terdekat / minimum antara data dengan titik pusat.
5. Lakukan iterasi
kemudian tentukan posisi centroid baru dengan menggunakan persamaan sebagai berikut:
๐ = ∑ ๐ฅ๐ ๐ ๐=1 ๐ ;๐ = 1,2,3,…๐
Dimana:
ยต = titik pusat / centroid pada cluster
๐ฅ๐ = objek ke-i
n = banyaknya objek / jumlah objek yang menjadi anggota cluster
Jika pusat cluster tidak berubah lagi maka proses clustering selesai, atau kembali ke langkah nomor 3 sampai pusat cluster tidak berubah lagi.



Tidak ada komentar:
Posting Komentar