//
ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY |
|
BACA FULL TEXT ABSTRAK Permintaan Versi cetak |
|
Pengarang | Zarita Herlin - Personal Name |
---|---|
Abstrak/Catatan ABSTRAK Vector Space Model (VSM) adalah salah satu metode yang dapat menghitung kemiripan dokumen berdasarkan sudut kosinus antar vektor dokumen yang disebut cosine similarity. Metode VSM unigram dapat menghitung kemiripan dokumen dengan baik, namun metode tersebut tidak dapat digunakan untuk membedakan urutan kata. Dengan menggabungkan metode VSM unigram dengan alignment similarity dapat menghitung kemiripan dokumen berdasarkan kalimat dengan mempertimbangkan urutan katanya. Alignment similarity adalah suatu perhitungan kesamaan posisi kata yang dilakukan dari sisi kiri ke kanan dan dari sisi kanan ke kiri. Namun pada metode tersebut, kemiripan dokumen akan menghasilkan nilai persentase yang berbeda jika terdapat penambahan kata pada awal dan akhir, atau pada tengah kalimat. Maka dari itu, pada penelitian ini perhitungan kemiripan dokumen berdasarkan kalimatnya dilakukan dengan menggunakan dua metode, yaitu metode VSM unigram - bigram dan metode VSM unigram - alignment similarity. Tujuan dilakukannya penelitian ini yaitu membandingkan persentase kemiripan dan waktu proses yang dihasilkan dari sistem perhitungan kemiripan dokumen menggunakan kedua metode di atas. Metode penelitian yang dilakukan yaitu dengan membandingkan 50 dokumen database dengan 11 dokumen uji, dimana 6 dokumen uji digunakan untuk menganalisa perbedaan persentase kemiripan dokumen, dan 5 dokumen uji lainnya digunakan untuk menganalisa perbedaan waktu proses yang dibutukan kedua metode di atas untuk menghitung kemiripan dokumen. Hasil yang didapatkan menunjukkan bahwa metode VSM unigram - bigram lebih efektif dalam menghitung kemiripan dokumen dengan urutan kata secara global, namun waktu proses yang dibutuhkan oleh metode tersebut lebih lama dibandingkan dengan metode VSM unigram - alignment similarity. Kata kunci : vector space model, cosine similarity, alignment similarity, unigram, bigram | |
Tempat Terbit | |
Literature Searching Service | Hard copy atau foto copy dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan isi formulir online (Chat Service LSS) |
Share Social Media | |
Tulisan yang Relevan PENENTUAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN VECTOR SPACE MODEL UNTUK MEMBANTU PENDETEKSIAN PLAGIARISME (Taufiq M Isa, 2020) |
|
Kembali ke sebelumnya |