Denny Syaputra. PERBANDINGAN PERFORMA METODE PARALEL SVM DAN K-NN DALAM MENGKLASIFIKASI PASANGAN AKRONIM DAN KEPANJANGANNYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK. Banda Aceh : Fakultas MIPA Universitas Syiah Kuala, 2020

Abstrak

Data dalam jumlah yang besar dihasilkan setiap detiknya, hal ini membuat jumlah data bertambah secara eksponensial. penambahan ini membawa masalah pada pemrosesan data karena akan membutuhkan waktu yang sangat lama apabila menggunakan satu mesin, untuk mengatasi hal tersebut maka proses komputasi bisa dilakukan secara paralel. salah satu hal yang dapat diekstrak dari data teks adalah akronim dan kepanjangannya. penelitian yang telah dilakukan pada ekstraksi pasangan akronim dan ekspansinya dari data teks masih menggunakan satu mesin. penelitian ini berfokus pada melakukan pembangkitan pasangan-pasangan kandidat akronim dan ekspansinya serta fitur-fiturnya dari 100.000 dan 200.000 data artikel menggunakan hadoop mapreduce dengan bahasa pemrograman perl dan java serta melakukan klasifikasi menggunakan apache spark untuk metode paralel svm dan k-nn. hasil yang didapat dari proses pembangkitan fitur-fitur pasangan kandidat akronim dan ekspansinya adalah perl dengan library hadoop streaming

Baca Juga : PENGUJIAN DAN PEMBAHARUAN ALGORITMA INDOACRO UNTUK PENENTUAN PASANGAN AKRONIM DAN KEPANJANGANNYA DARI DATA TEKS DALAM BAHASA INGGRIS (ARIQ NAUFAL KAMIL, 2020) ,

Baca Juga : MEMBANDINGKAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) DAN K-NEAREST NEIGHBOR (KNN) DALAM MEMBANGUN REPOSITORI AKRONIM-EKSPANSI DARI HALAMAN WEB SECARA OTOMATIS (Amir Mahazir, 2016) ,

jauh mengungguli java dalam melakukan pembangkitan fitur. saat memproses 200.000 artikel, perl dengan 39 server hanya membutuhkan waktu 2 jam 2 menit sementara java membutuhkan waktu 22 jam 28 menit. sedangkan selama proses klasifikasi, meskipun paralel svm memiliki nilai f-measure yang sedikit lebih rendah dibandingkan k-nn, namun paralel svm membutuhkan waktu yang jauh lebih sedikit. waktu yang dibutuhkan paralel svm untuk mengklasifikasi 119 juta pasangan kandidat akronim dan ekspansinya menggunakan 39 server adalah 1 menit 18 detik sedangkan k-nn membutuhkan 26 menit 42

Pengarang tidak dapat memberikan Full Text secara langsung, untuk mendapatkan full text silahkan menghubungi email pengarang : denny.s@mhs.unsyiah.ac.id atau dapat mengisi Form LSS di bawah.

Literature Searching Service



Tulisan yang relevan

PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK (TEUKU WAHYU ARDHIAN PUTERA, 2020) ,

KEMAMPUAN SISWA KELAS XI SMAN 16 BANDA ACEH MEMAHAMI AKRONIM DALAM SURAT KABAR HARIAN SERAMBI INDONESIA (Faizal , 2014) ,

PENGARUH KETERLIBATAN KERJA TERHADAP PERFORMA KERJA DENGAN KOMITMEN ORGANISASIONAL SEBAGAI PEMEDIASI PADA PT. BANK ACEH KANTOR PUSAT OPERASIONAL BANDA ACEH (JUFRIADI, 2017) ,


Kembali ke halaman sebelumnya


Pencarian

Advance



Jenis Akses


Tahun Terbit

   

Program Studi