//

KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP

BACA FULL TEXT ABSTRAK Permintaan Versi cetak
Pengarang SYAMSUL KAMAL - Personal Name
SubjectCOMPUETR SYSTEM - PROGRAM
Bahasa Indonesia
Fakultas FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA
Tahun Terbit 2017

Abstrak/Catatan

Di dunia yang sangat terhubung, besarnya variasi data tumbuh dan berkembang. Sejumlah besar data dihasilkan dari sensor, satelit, media sosial dan lainnya. Salah satu cara untuk menangani data besar adalah menggunakan Hadoop. Platform Hadoop digunakan untuk menyimpan, mengelola, dan mendistribusi data besar di beberapa node server. Dalam penelitian ini digunakan metode Naïve Bayesian dan Random Forest. Data sensor yangdigunakan berjumlah 10 juta baris. Ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal dan mengkonfigurasi Hadoop, preprocessing data, mengubah format data ke bentuk file berurutan dan melakukan klasifikasi. Akurasi klasifikasi diukur dengan menggunakan f-measure. Hasil penelitian menunjukkan bahwa metode Random Forest lebih baik daripada metode Naïve Bayesian dengan nilai akurasi tertinggi fmeasure dari Random Forest adalah 1 dan nilai akurasi tertinggi f-measure dari Naïve Bayesian adalah 0,66. Dalam hal waktu klasifikasi Naïve Bayesian lebih baik dari pada Random Forest. Pada cluster Hadoop, penambahan slave node dapat mempengaruhi kecepatan Hadoop. Kata kunci : Apache Hadoop, Apache Mahout, Klasifikasi, Naïve Bayesian, Random Forest

Tempat Terbit Banda Aceh
Literature Searching Service

Hard copy atau foto copy dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan isi formulir online (Chat Service LSS)

Share Social Media

Tulisan yang Relevan

KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN (Mauliana, 2016)

PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK (TEUKU WAHYU ARDHIAN PUTERA, 2020)

PERANGCANGAN DAN PEMBUATAN SISTEM INFORMASI BERBASIS WEBSITE REGISTERASI SECARA DARING CALON PENERIMA BEASISWA (SAID ALFIYATUSY SYUKRA, 2018)

PENGARUH PENERAPAN SISTEM INFORMASI AKUNTANSI, KEMAMPUAN TEKNIK PEMAKAI SISTEM INFORMASI AKUNTANSI, PEMANFAATAN TEKNOLOGI INFORMASI, DAN KEPERCAYAAN PENGGUNAAN TEKNOLOGI INFORMASI TERHADAP KINERJA KARYAWAN (STUDI EMPIRIS PADA SATUAN KERJA PERANGKAT KOTA BANDA ACEH) (Ade Maulina, 2016)

PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP (Amalul Ahli, 2018)

  Kembali ke sebelumnya

Pencarian

Advance



Jenis Akses


Tahun Terbit

   

Program Studi

   

© UPT. Perpustakaan Universitas Syiah Kuala 2015     |     Privacy Policy