SKRIPSI

File Icon

INTEGRASI TF-IDF DAN ALGORITMA COSINE SIMILARITY UNTUK DETEKSI TINGKAT KEMIRIPAN JUDUL PENELITIAN TEKNIK INFORMATIKA

Tanggal Upload: 01/06/2025

Penulis / NIM:
SITTI MEAUTIAH DEVI AMELIA JAN / T3119082

Program Studi:
S1 Teknik Informatika

Tahun Akademik:
2023

Kata Kunci:
Similarity, Judul, TF-IDF, Cosine Similarity, Deteksi.

Abstrak:

Penjiplakan/plagiarisme masih sering terjadi, terutama dalam dunia akademik. Penjiplakan banyak dilakukan terutama saat menyelesaikan tugas akhir atau skripsi. Untuk menghindari kegiatan plagiat perlu dilakukan dengan mendeteksi kemiripan atau kesamaan judul TA. Deteksi Similaritas dilakukan untuk memeriksa kesamaan dokumen dengan dokumen lain. Salah satu solusi untuk memeriksa / mendeteksi kemiripan dokumen secara cepat dan tepat adalah dengan penerapan algoritma Cosine Similarity dan pembobotan TF-IDF. Penelitian ini bertujuan untuk mengetahui kinerja dari algoritma Cosine Similarity dalam mendeteksi tingkat kemiripan tugas akhir atau penelitian. Dengan memanfaatkan preprocessing teks yang terdiri dari case folding, tokenizing, stopword removal, dan stemming yang selanjutnya dilakukan perhitungan pembobotan TF-IDF dan nilai kemiripan menggunakan cosine similarity sehingga mendapatkan nilai persentase kemiripan. Hasil dari percobaan pada penelitian ini adalah berupa tingkat kemiripan dari judul tugas akhir yang dibandingkan, dengan pengujian confusion matrix diperoleh nilai accuracy memliki rata-rata sebesar 89.7%, precision 72.4%, dan recall 94.6%.
Berkas Lampiran
Unduh File