KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN

Mauliana

Abstrak/Catatan Twitter merupakan salah satu microbloging populer di mana pengguna dapat membaca dan mengirim pesan teks dengan maksimal 140 karakter. Indonesia merupakan negara kelima terbesar di dunia sebagai pengguna Twitter paling aktif berdasarkan penelitian Semiocast pada tahun 2012. Banyaknya pengguna Twitter di Indonesia membuat tweet berbahasa Indonesia berjumlah sangat besar. Hal ini dapat dijadikan sebagai sumber data untuk memperoleh informasi. Salah satu metode dalam teks mining yang dapat digunakan untuk mengolah data Twitter adalah klasifikasi. Metode klasifikasi yang digunakan dalam penelitian ini adalah k-Nearest Neighbors (k-NN) dan Naïve Bayesian. Klasifikasi dilakukan dengan mengategorikan tweet menjadi 4 kelas yaitu bencana, kriminal, olahraga, dan lainnya. Tweet yang diklasifikasikan hanyalah tweet yang terdapat hashtag aceh (#aceh) di dalamnya. Data yang digunakan pada penelitian ini berjumlah 16.440 data Twitter dan 10.000 data berita online. Tahapan penelitian ini terdiri dari pengumpulan data, pembersihan data, pembuatan kamus n-gram, pembangkitan fitur, dan klasifikasi. Kamus dibangun dari data Twitter dan data berita. Pengujian dilakukan menggunakan data Twitter berlabel dan tidak berlabel. Pada data tidak berlabel dilakukan proses prediksi sebelum dilakukan klasifikasi. Hasil klasifikasi menunjukkan algoritma k-NN memiliki akurasi lebih baik dibandingkan algoritma Naïve Bayesian. Nilai f-measure tertinggi yaitu 0,812 diperoleh pada pengujian dengan k = 7, sedangkan nilai ROC tertinggi diperoleh pada k = 9 yaitu 0,736. Dari segi waktu klasifikasi, algoritma Naïve Bayesian lebih unggul dibandingkan k-NN. Kata kunci : Twitter, klasifikasi, k-NN, Naïve Bayesian
KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN
	BACA FULL TEXT ABSTRAK Permintaan Versi cetak
Pengarang	Mauliana - Personal Name
Subject	COMPUTER SCIENCE
Bahasa	Indonesia
Fakultas	FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA
Tahun Terbit	2016
Tempat Terbit	Banda Aceh
Literature Searching Service	Hard copy atau foto copy dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan isi formulir online (Chat Service LSS)
Share Social Media	Bagikan
Tulisan yang Relevan KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP *(SYAMSUL KAMAL, 2017)* PENGENALAN CITRA ANGKA TULISAN TANGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS *(Mifthahul Jannah, 2019)* ANALISIS SENTIMEN MASYARAKAT DI TWITTER TERHADAP UNIVERSITAS SYIAH KUALA MENGGUNAKAN METODE KLASIFIKASI SUPPORT VECTOR MACHINES (SVM) *(FIKA RASITA SARI, 2017)* PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK *(TEUKU WAHYU ARDHIAN PUTERA, 2020)* PENGUJIAN DAN PEMBAHARUAN ALGORITMA INDOACRO UNTUK PENENTUAN PASANGAN AKRONIM DAN KEPANJANGANNYA DARI DATA TEKS DALAM BAHASA INGGRIS *(ARIQ NAUFAL KAMIL, 2020)*
	Kembali ke sebelumnya

Terkini

	PROSPEK EKSPOR KOPI ARABIKA ORGANIK BERSERTIFIKAT DI KABUPATEN ACEH TENGAH
	ANALISIS KOMPARATIF TINGKAT PENDAPATAN USAHATANI PADI SAWAH IRIGASI DAN PADI SAWAH TADAH HUJAN BERDASARKAN STATUS PENGUASAAN LAHAN DI KECAMATAN KUTA COT GLIE KABUPATEN ACEH BESAR
	KAJIAN PEMASARAN DAN KEUNTUNGAN PETANI KACANG TANAH DI KECAMATAN DARUSSALAM KABUPATEN ACEH BESAR
	STUDI PENDAPATAN RUMAH TANGGA PERTANIAN DI DATARAN TINGGI (KASUS DESA URING KECAMATAN BUKIT KABUPATEN BENER MERIAH)
	ANALISIS PENDAPATAN USAHATANI TEMBAKAU DI KECAMATAN BANDAR BARU KABUPATEN PIDIE JAYA

KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN

Abstrak/Catatan

Tulisan yang Relevan

Pencarian

Terkini

PROSPEK EKSPOR KOPI ARABIKA ORGANIK BERSERTIFIKAT DI KABUPATEN ACEH TENGAH

ANALISIS KOMPARATIF TINGKAT PENDAPATAN USAHATANI PADI SAWAH IRIGASI DAN PADI SAWAH TADAH HUJAN BERDASARKAN STATUS PENGUASAAN LAHAN DI KECAMATAN KUTA COT GLIE KABUPATEN ACEH BESAR

KAJIAN PEMASARAN DAN KEUNTUNGAN PETANI KACANG TANAH DI KECAMATAN DARUSSALAM KABUPATEN ACEH BESAR

STUDI PENDAPATAN RUMAH TANGGA PERTANIAN DI DATARAN TINGGI (KASUS DESA URING KECAMATAN BUKIT KABUPATEN BENER MERIAH)

ANALISIS PENDAPATAN USAHATANI TEMBAKAU DI KECAMATAN BANDAR BARU KABUPATEN PIDIE JAYA

Kategori

Jenis Akses

Tahun Terbit

Program Studi

Pencarian Spesifik

KLASIFIKASI DATA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE K-NEAREST NEIGHBORS DAN NAÏVE BAYESIAN

Abstrak/Catatan

Tulisan yang Relevan

Pencarian

Terkini

PROSPEK EKSPOR KOPI ARABIKA ORGANIK BERSERTIFIKAT DI KABUPATEN ACEH TENGAH

ANALISIS KOMPARATIF TINGKAT PENDAPATAN USAHATANI PADI SAWAH IRIGASI DAN PADI SAWAH TADAH HUJAN BERDASARKAN STATUS PENGUASAAN LAHAN DI KECAMATAN KUTA COT GLIE KABUPATEN ACEH BESAR

KAJIAN PEMASARAN DAN KEUNTUNGAN PETANI KACANG TANAH DI KECAMATAN DARUSSALAM KABUPATEN ACEH BESAR

STUDI PENDAPATAN RUMAH TANGGA PERTANIAN DI DATARAN TINGGI (KASUS DESA URING KECAMATAN BUKIT KABUPATEN BENER MERIAH)

ANALISIS PENDAPATAN USAHATANI TEMBAKAU DI KECAMATAN BANDAR BARU KABUPATEN PIDIE JAYA

Kategori

Jenis Akses

Tahun Terbit

Program Studi