Pengukuran Kinerja Model Klasifikasi dengan Data Oversampling pada Algoritma Supervised Learning untuk Penyakit Jantung

Penulis

  • Anis Fitri Nur Masruriyah Universitas Buana Perjuangan Karawang
  • Hilda Yulia Novita Universitas Buana Perjuangan Karawang
  • Cici Emilia Sukmawati Universitas Buana Perjuangan Karawang
  • Angga Ramda Ramadhan Universitas Buana Perjuangan Karawang
  • Siti Novianti Nuraini Arif Universitas Buana Perjuangan Karawang
  • Budi Arif Dermawan Universitas Singaperbangsa Karawang

DOI:

https://doi.org/10.31294/coscience.v4i1.2389

Kata Kunci:

ADASYN, Klasifikasi, Penyakit Jantung, SMOTE, Supervised Learning

Abstrak

Penyakit jantung tetap menjadi penyebab utama kematian di Indonesia dan dunia. Dalam data mining, ketidakseimbangan kelas antara sampel penyakit jantung dan normal dalam dataset adalah masalah serius. Hal ini dapat mengarah pada bias model ke arah kelas mayoritas, mengakibatkan kinerja buruk dalam mengidentifikasi kasus penyakit jantung yang lebih sedikit. Penelitian ini mengatasi masalah ini dengan menerapkan teknik oversampling, khususnya Synthetic Minority Over-sampling Technique (SMOTE) dan Adaptive Synthetic Sampling (ADASYN). Hasilnya menunjukkan bahwa model tanpa oversampling mencapai akurasi dan presisi di atas 80%, namun memiliki kinerja yang buruk dalam memisahkan kelas. Model yang memanfaatkan oversampling, meskipun dengan penurunan akurasi dan presisi, berhasil meningkatkan kemampuan dalam membedakan kelas penyakit jantung dan normal. Model terbaik menggunakan algoritma Random forest dengan SMOTE mencapai nilai AUC sebesar 0.868, menandakan peningkatan yang signifikan dalam pemisahan kelas. Temuan ini memberikan panduan penting bagi pengembangan model klasifikasi penyakit jantung yang lebih efektif dan akurat. Penggunaan teknik oversampling, seperti SMOTE, terbukti menjadi strategi yang efektif untuk mengatasi ketidakseimbangan kelas dalam data mining penyakit jantung. Meskipun akurasi dan presisi dapat mengalami penurunan, kemampuan model dalam mengidentifikasi penyakit jantung menjadi lebih andal, dengan hasil yang diukur menggunakan AUC yang signifikan. Penelitian ini berkontribusi pada upaya meningkatkan pencegahan dan pengobatan penyakit jantung melalui teknik data mining yang canggih dan berkelanjutan.

##submission.downloads##

Diterbitkan

2024-01-31

Terbitan

Bagian

Articles