//
KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP |
|
BACA FULL TEXT ABSTRAK Permintaan Versi cetak |
|
Pengarang | SYAMSUL KAMAL - Personal Name |
---|---|
Subject | COMPUETR SYSTEM - PROGRAM |
Bahasa | Indonesia |
Fakultas | FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA |
Tahun Terbit | 2017 |
Abstrak/Catatan Di dunia yang sangat terhubung, besarnya variasi data tumbuh dan berkembang. Sejumlah besar data dihasilkan dari sensor, satelit, media sosial dan lainnya. Salah satu cara untuk menangani data besar adalah menggunakan Hadoop. Platform Hadoop digunakan untuk menyimpan, mengelola, dan mendistribusi data besar di beberapa node server. Dalam penelitian ini digunakan metode Naïve Bayesian dan Random Forest. Data sensor yangdigunakan berjumlah 10 juta baris. Ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal dan mengkonfigurasi Hadoop, preprocessing data, mengubah format data ke bentuk file berurutan dan melakukan klasifikasi. Akurasi klasifikasi diukur dengan menggunakan f-measure. Hasil penelitian menunjukkan bahwa metode Random Forest lebih baik daripada metode Naïve Bayesian dengan nilai akurasi tertinggi fmeasure dari Random Forest adalah 1 dan nilai akurasi tertinggi f-measure dari Naïve Bayesian adalah 0,66. Dalam hal waktu klasifikasi Naïve Bayesian lebih baik dari pada Random Forest. Pada cluster Hadoop, penambahan slave node dapat mempengaruhi kecepatan Hadoop. Kata kunci : Apache Hadoop, Apache Mahout, Klasifikasi, Naïve Bayesian, Random Forest | |
Tempat Terbit | Banda Aceh |
Literature Searching Service | Hard copy atau foto copy dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan isi formulir online (Chat Service LSS) |
Share Social Media | |
Tulisan yang Relevan KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN (Mauliana, 2016) |
|
Kembali ke sebelumnya |