DanuKartiwaWorld: Oktober 2018

Minggu, 14 Oktober 2018

Classification,Regression dan Clustering

Pada kesempatan kali ini kita akan mencoba mengolah data menggunakan 3 metode yaitu :

1. Classification (Predictive)
2. Regression (Predictive)
3. Clustering (Descriptive)

Data-data diatas saya dapatkan dari Badan Pusat Statistik daerah Jawa Barat.Data tersebut membahas mengenai produksi padi menurut kabupaten dan kota di Jawa Barat.

langsung saja kita ke pembahasan.

1. Classification (Predictive)

Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari beberapa kategori (atau klas) yang telah didefinisikan sebelumnya. Disebut juga dengan “supervised learning”.
Dengan metode ini kita dapat mengetahui daerah mana saja yang memiliki tingkat produksi padi yang rendah dan harus ditingkatkan dan daerah mana saja yang memiliki tingkat produksi padi yang tinggi dan harus dipertahankan.

2. Regression (Predictive)

Memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier.
Dengan metode ini kita dapat memprediksi hasil produksi padi apakah ada penurunan atau kenaikan dalam 6 tahun terakhir.Selain itu kita juga dapat mengetahui kecepatan kenaikan atau pun penurunan produksi padi tersebut.

3. Clustering (Descriptive)

Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Disebut juga dengan “unsupervised learning”.
Dengan menggunakan metode Clustering,kita dapat mengelompokan data data diatas,contohnya:
Membagi wilayah Provinsi produksi padi menurut jumlahnya yaitu diatas 500 ribu ton dan yang dibawah 500 ribu ton.

Minggu, 07 Oktober 2018

Bedah Jurnal 2

Kita Langsung masuk ke pembahasan selanjutnya, yaitu:

4. DATA DATA YANG DIGUNAKAN

Ada 3 data yang di ambil dalam proses pemetaan ini yaitu data Murid dan Guru SD,SMP dan SMA di Provinsi Banten.

Dalam Sistem Informasi Geografis dapat diuraikan menjadi beberapa subsistem sebagai berikut:
a. Data Input
Data input pada sistem adalah: data jumlah guru, jumlah sekolah, jumlah murid pada tingkat SD, SMP dan SMA di Provinsi Banten serta peta Provinsi Banten.
b. Data Output
Subsistem output atau luaran sistem untuk menyajikan informasi seperti peta Provinsi Banten, tabel hasil clustering K-Means dan analisis cluster.
c. Data Management
Data management pada sistem bertugas untuk mengorganisasikan baik data spasial maupun tabel ke dalam sebuah basis data sehingga data dapat dengan mudah dikelompokan menggunakan metode K-Means.
d. Data Manipulation
Data manipulation pada sistem bertugas dalam menentukan informasi-informasi yang dapat dihasilkan oleh Sistem Informasi Geografis dan pemodelan untuk menghasilkan informasi yang diharapkan.

5. METODE YANG DIGUNAKAN UNTUK PENGOLAHAN DATA

Dalam kasus ini,Pemetaan guru di Provinsi Banten,data jumlah guru,data jumlah murid dan data jumlah sekolah dikelompokkan menggunakan metode clustering K-Means.
Langkah-langkah dalam melakukan algoritma KMeans:
1. Menentukan banyak cluster
Menentukan banyak cluster sesuai dengan masalah yang diteliti untuk mempermudah mengelompokkan data yang memiliki karakter sejenis.
2. Menentukan titik pusat
Selanjutnya menentukan titik pusat (centroid) dari tiap-tiap cluster. Pengambilan titik pusat secara random (acak).
3. Menghitung jarak setiap objek ke titik pusat
Kemudian menghitung jarak setiap data dengan titik pusat yang sudah ditentukan sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah:

𝑑(𝑥,𝑦) = √(𝑥1 − 𝑦1)2 + (𝑥2 − 𝑦2)2 + ⋯+ (𝑥𝑝 − 𝑦𝑝)2

4. Mengelompokkan objek berdasarkan jarak terdekat
Mengelompokkan objek berdasarkan jarak terdekat / minimum antara data dengan titik pusat.
5. Lakukan iterasi
kemudian tentukan posisi centroid baru dengan menggunakan persamaan sebagai berikut:

𝜇 = ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 ;𝑖 = 1,2,3,…𝑛

Dimana:
µ = titik pusat / centroid pada cluster
𝑥𝑖 = objek ke-i
n = banyaknya objek / jumlah objek yang menjadi anggota cluster

Jika pusat cluster tidak berubah lagi maka proses clustering selesai, atau kembali ke langkah nomor 3 sampai pusat cluster tidak berubah lagi.

Jumat, 05 Oktober 2018

Bedah Jurnal 1

BEDAH JURNAL : Pemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metode

Spatial Clustering K-Means

(Studi kasus : Wilayah Provinsi Banten)

Baca judulnya aja bingung kan??? iya sama 😂.

Ini adalah salah satu tugas yang diberikan oleh ibu dosen (ibu eli) yang baik hati kepada kami para mahasiswanya,yaitu membedah sebuah jurnal.

Bingung sudah pasti,tapi apa iya kita akan menyerah dengan kebingungan itu(bijak 😎-ceritanya),ya seenggaknya kita bisa searching-searching di OM GOOGLE bagaimana cara membedah sebuah jurnal atau bagaimana cara membacanya,jadi jangan pesimis dulu,😁

Jurnal yang akan saya coba bedah kali ini adalah jurnal dari Yohanes Adi Prihambodo dan Sri Yulianto Joko Prasetyo yang berjudul Pemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metode Spatial Clustering K-Means(Studi kasus:Wilayah Provinsi Banten).Point-point yang akan dibahas adalah :

- Permasalahan apa yang terdapat dalam jurnal tersebut

- Metode apa yang digunakan

- Hipotesa (Kesimpulan sementara)

ini dia contoh jurnalnya,

Jurnal : Yohanes Aji Priambodo, Sri Yulianto Joko Prasetyo)Pemetaan Penyebaran Guru di Provinsi Banten
dengan Menggunakan Metode Spatial Clustering K-Means
(Studi kasus : Wilayah Provinsi Banten)

Langsung saja kita bahas point demi point tersebut

1. PERMASALAHAN

Setelah saya baca baris demi baris,dapat diambil kesimpulan (mudah mudahan bener ya) bahwa permasalahan yang terdapat dalam jurnal diatas adalah perlu dilakukannya pemerataan guru di provinsi Banten ,karena hampir semua kabupaten dan kota di provinsi banten mengalami ketidakmerataan dalam penyebaran guru.

2. METODE

Didalam abstrak di jelaskan kalau penulis jurnal dalam penelitiannya menggunakan metode Clustering,yaitu menyusun data dalam kelompok-kelompok data,hal itu dilakukan dengan menggunakan algoritma K-Means.

3. HIPOTESIS (Kesimpulan Sementara)

Masih didalam Abstrak,penulis mengemukakan kalau hasil dari penelitian ini adalah pemetaan wilayah provinsi Banten berdasarkan jenjang pendidikan yang memiliki kekurangan,kecukupan dan kelebihan guru sesuai dengan kabupaten dan kota,dan juga dapat menjadi sarana bagi Dina Pendidikan provinsi Banten dalam hal pemetaan guru.

fiuuuuh!!!...selesai juga,

Mudah-mudahan hasil bedahnya bener 😅