Pada kesempatan kali ini kita akan mencoba mengolah data menggunakan 3 metode yaitu :
1. Classification (Predictive)
2. Regression (Predictive)
3. Clustering (Descriptive)
Data-data diatas saya dapatkan dari Badan Pusat Statistik daerah Jawa Barat.Data tersebut membahas mengenai produksi padi menurut kabupaten dan kota di Jawa Barat.
langsung saja kita ke pembahasan.
1. Classification (Predictive)
Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari beberapa kategori (atau klas) yang telah didefinisikan sebelumnya. Disebut juga dengan “supervised learning”.
Dengan metode ini kita dapat mengetahui daerah mana saja yang memiliki tingkat produksi padi yang rendah dan harus ditingkatkan dan daerah mana saja yang memiliki tingkat produksi padi yang tinggi dan harus dipertahankan.
Dengan metode ini kita dapat mengetahui daerah mana saja yang memiliki tingkat produksi padi yang rendah dan harus ditingkatkan dan daerah mana saja yang memiliki tingkat produksi padi yang tinggi dan harus dipertahankan.
Memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier.
Dengan metode ini kita dapat memprediksi hasil produksi padi apakah ada penurunan atau kenaikan dalam 6 tahun terakhir.Selain itu kita juga dapat mengetahui kecepatan kenaikan atau pun penurunan produksi padi tersebut.
3. Clustering (Descriptive)
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Disebut juga dengan “unsupervised learning”.
Dengan menggunakan metode Clustering,kita dapat mengelompokan data data diatas,contohnya:
Membagi wilayah Provinsi produksi padi menurut jumlahnya yaitu diatas 500 ribu ton dan yang dibawah 500 ribu ton.
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Disebut juga dengan “unsupervised learning”.
Dengan menggunakan metode Clustering,kita dapat mengelompokan data data diatas,contohnya:
Membagi wilayah Provinsi produksi padi menurut jumlahnya yaitu diatas 500 ribu ton dan yang dibawah 500 ribu ton.



