SYAMSUL KAMAL. KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP. Banda Aceh : Universitas Syiah Kuala, 2017

Abstrak

Di dunia yang sangat terhubung, besarnya variasi data tumbuh dan berkembang. sejumlah besar data dihasilkan dari sensor, satelit, media sosial dan lainnya. salah satu cara untuk menangani data besar adalah menggunakan hadoop. platform hadoop digunakan untuk menyimpan, mengelola, dan mendistribusi data besar di beberapa node server. dalam penelitian ini digunakan metode naïve bayesian dan random forest. data sensor yangdigunakan berjumlah 10 juta baris. ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal dan mengkonfigurasi hadoop, preprocessing data, mengubah format data ke bentuk file berurutan dan melakukan klasifikasi. akurasi klasifikasi diukur dengan menggunakan f-measure. hasil penelitian menunjukkan bahwa metode random forest lebih baik daripada metode naïve bayesian dengan nilai akurasi tertinggi fmeasure dari random forest adalah 1 dan nilai akurasi tertinggi f-measure dari naïve bayesian adalah 0,66. dalam hal waktu klasifikasi naïve bayesian

Baca Juga : KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN (Mauliana, 2016) ,

Baca Juga : PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK (TEUKU WAHYU ARDHIAN PUTERA, 2020) ,

lebih baik dari pada random forest. pada cluster hadoop, penambahan slave node dapat mempengaruhi kecepatan hadoop. kata kunci : apache hadoop, apache mahout, klasifikasi, naïve bayesian, random

Tulisan yang relevan

PERANGCANGAN DAN PEMBUATAN SISTEM INFORMASI BERBASIS WEBSITE REGISTERASI SECARA DARING CALON PENERIMA BEASISWA (SAID ALFIYATUSY SYUKRA, 2018) ,

PENGARUH PENERAPAN SISTEM INFORMASI AKUNTANSI, KEMAMPUAN TEKNIK PEMAKAI SISTEM INFORMASI AKUNTANSI, PEMANFAATAN TEKNOLOGI INFORMASI, DAN KEPERCAYAAN PENGGUNAAN TEKNOLOGI INFORMASI TERHADAP KINERJA KARYAWAN (STUDI EMPIRIS PADA SATUAN KERJA PERANGKAT KOTA BANDA ACEH) (Ade Maulina, 2016) ,

PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP (Amalul Ahli, 2018) ,


Kembali ke halaman sebelumnya


Pencarian

Advance



Jenis Akses


Tahun Terbit

   

Program Studi