Zarita Herlin. ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY. Banda Aceh : Fakultas MIPA Universitas Syiah Kuala, 2019

Abstrak

Abstrak vector space model (vsm) adalah salah satu metode yang dapat menghitung kemiripan dokumen berdasarkan sudut kosinus antar vektor dokumen yang disebut cosine similarity. metode vsm unigram dapat menghitung kemiripan dokumen dengan baik, namun metode tersebut tidak dapat digunakan untuk membedakan urutan kata. dengan menggabungkan metode vsm unigram dengan alignment similarity dapat menghitung kemiripan dokumen berdasarkan kalimat dengan mempertimbangkan urutan katanya. alignment similarity adalah suatu perhitungan kesamaan posisi kata yang dilakukan dari sisi kiri ke kanan dan dari sisi kanan ke kiri. namun pada metode tersebut, kemiripan dokumen akan menghasilkan nilai persentase yang berbeda jika terdapat penambahan kata pada awal dan akhir, atau pada tengah kalimat. maka dari itu, pada penelitian ini perhitungan kemiripan dokumen berdasarkan kalimatnya dilakukan dengan menggunakan dua metode, yaitu metode vsm unigram - bigram dan

Baca Juga : PENENTUAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN VECTOR SPACE MODEL UNTUK MEMBANTU PENDETEKSIAN PLAGIARISME (Taufiq M Isa, 2020) ,

Baca Juga : TRANSFORMASI BESARAN TEGANGAN DAN ARUS TIGA FASA MENJADI SPACE VECTOR UNTUK PENGUKURAN DAYA AKTIF DAN REAKTIF (CUT PUTRI MIRNA, 2020) ,

tode vsm unigram - alignment similarity. tujuan dilakukannya penelitian ini yaitu membandingkan persentase kemiripan dan waktu proses yang dihasilkan dari sistem perhitungan kemiripan dokumen menggunakan kedua metode di atas. metode penelitian yang dilakukan yaitu dengan membandingkan 50 dokumen database dengan 11 dokumen uji, dimana 6 dokumen uji digunakan untuk menganalisa perbedaan persentase kemiripan dokumen, dan 5 dokumen uji lainnya digunakan untuk menganalisa perbedaan waktu proses yang dibutukan kedua metode di atas untuk menghitung kemiripan dokumen. hasil yang didapatkan menunjukkan bahwa metode vsm unigram - bigram lebih efektif dalam menghitung kemiripan dokumen dengan urutan kata secara global, namun waktu proses yang dibutuhkan oleh metode tersebut lebih lama dibandingkan dengan metode vsm unigram - alignment similarity. kata kunci : vector space model, cosine similarity, alignment similarity, unigram,

Pengarang tidak dapat memberikan Full Text secara langsung, untuk mendapatkan full text silahkan menghubungi email pengarang : zarita.herlin@s1.informatika.unsyiah.ac.id atau dapat mengisi Form LSS di bawah.

Literature Searching Service



Tulisan yang relevan

KAJIAN MOLEKULER KARAKTERISTIK GEN CALPASTATIN (CAST) PADA KAMBING BOERKA (CAPRA HIRCUS) (Sri Yuliati, 2018) ,

EKSPLORASI BAKTERI ENDOFIT DARI AKAR PADI (ORYZA SATIVA L.) SEBAGAI PELARUT KALIUM (WARZATULLISNA, 2019) ,

IDENTIFIKASI BAKTERI PATOGEN PADA IKAN KAKAP (LUTJANUS SP.) ASAL PERAIRAN BANDA ACEH BERDASARKAN ANALISIS GEN 16S RRNA (WINDY BUDI SETIAWANDI, 2020) ,


Kembali ke halaman sebelumnya


Pencarian

Advance



Jenis Akses


Tahun Terbit

   

Program Studi