Kamis, 18 Mei 2017

Klasifikasi Data menggunakan Weka - DAMIN

Pada postingan kali ini, saya akan melakukan Penambangan Data / Data Mining dengan menggunakan aplikasi WEKA dan dataset yang dapat anda ambil di website UCI Machine Learning Repository.
Untuk mengetahui lebih jelas tentang dataset yang telah disediakan UCI. Anda dapat mengklik gambar ini.


Dataset yang saya ambil adalah dataset lanses. Saya akan melakukan penambangan data dengan menggunakan teknik “Klasifikasi” menggunakan method “tree”.
Untuk melakukan penambangan, sebaiknya anda telah mengistall aplikasi yang dapat melakukan penambangan data. Pada kasus ini saya menggunakan aplikasi weka yang dapat kalian ambil di 

Weka.

Untuk langkah-langkahnya sbb :

- Buka website https://archive.ics.uci.edu/ml/datasets/lenses

- Klik Data Folder

- Download semua datanya
- Buka lenses.data dengan menggunakan notepad

- Tambahkan nama atribut pada lenses.data sesuai dengan informasi yang ada di file lenses.names lalu simpan file dengan format CSV




   (Setelah ditambahkan nama atribut )





- Langkah selanjutnya buka aplikasi weka, klik Explorer.

- Klik open file

- Pilih file lenses.csv dan klik open

- Ubah daya yang berbentuk Numerik ke Nominal dengan mengklik Choose -> Filters -> Unsupervised -> attribute -> NumericToNominal->klik Apply


- Visualisasi akan berubah dari Numeric menjadi Nominal.

- Ubah nama value pada selected attribute untuk memudahkan pembacaan visualisasi. Pilih Choose->Filters->Unsupervised->attribute->RenameNominalValues

Klik field di RenameNominalValues, ubah selectedAttribute sesuai nama attribute dan ubah valueReplacements dengan format nilai asal : nilai pengganti. Klik OK

Pilih apply dan ulangi sampai semua value data telah terganti sesuai data informasi pada lenses.names


- Selanjutnya melakukan klasifikasi. Klik Classify->Choose->Tree->J48. Pilih Percentage split 90%. Klik start

- Anda dapat melihat informasi data yang telah di klasifikasikan. Semakin besar Correctly Classified Instances semakin baik

Kemudian klik kanan pada trees.J48 di result list pilih visualize tree

Pada visualisasi, apabila Tear Production rate = reduce maka hasilnya not dengan jumlah data 12. Apabila Tear Production rate = normal maka akan dilakukan pengecekan Astigmatic. Apabila Astigmatic = no maka hasilnya soft dengan perbandingan data 6:1 yang artinya dari 6 data hanya 1 data yang bukan menggunakan soft. Apabila astigmaticnya = yes, maka akan dilakukan pengecekan spectacle prescriotion. apabila spectacle prescriotion = myope maka hasilnya hard dengan jumlah data 3 dan apabila spectacle prescriotion = hypermetrope maka hasilnya not dengan perbandingan data 3 : 1 yaitu dari 3 data hanya 1 data yang bukan not.


Jika anda masih bingung dengan tutorial di atas, anda dapat langsung tonton videonya disini :



Tidak ada komentar:

Posting Komentar