MODEL K-NEAREST NEIGHBOR YANG EFISIEN UNTUK PREDIKSI PENYAKIT JANTUNG
Tanggal Upload: 01/09/2024
Penulis / NIM:
YOLANDA DJAFAR / T3114090
Program Studi:
S1 Teknik Informatika
Abstrak:
Kematian yang disebabkan penyakit jantung masih sangat tinggi, sehingga perlu peningkatan upaya-upaya pencegahannya, misalnya dengan meningkatkan capaian model prediksinya. Penerapan metode-metode machine learning pada dataset publik (Cleveland, Hungary, Switzerland, VA Long Beach, & Statlog) yang umumnya digunakan oleh para peneliti untuk prediksi penyakit jantung, termasuk pengembangan alat bantunya, masih belum menangani missing value, noisy data, unbalanced class, dan bahkan data validation secara efisien. Oleh karena itu, pendekatan secara manual dilakukan untuk Unbalanced Class Reduction (UCR), pendekatan imputasi mean/mode (average) diusulkan untuk menangani Missing Value Replacement (MVR), Min-Max Normalization untuk menangani Smoothing Noisy Data (SND), K-Fold Cross Validation untuk menangani data validation, dan metode k-Nearest Neighbor (k-NN) untuk klasifikasi. Hasil penelitian ini menunjukkan bahwa metode yang diusulkan ini, yaitu k-NN (k=2, distance measure = cityblock, vote rule = nearest) + UCR + MVR + SND memberikan akurasi sebesar 86,6427%, lebih baik 5,6324?ripada k-NN tanpa SND dan lebih efisien daripada missing value removed. Dengan demikian, model yang diusulkan ini dapat meningkatkan kinerja akurasi dan efisiensi model k-NN untuk prediksi Penyakit Jantung.