MENGGUNAKAN BINARY CLASSIFICATION UNTUK MENDETEKSI SPAM PADA SMS DENGAN METODE LOGISTIC REGRESSION

Authors

  • Hendra Hendra Institut Teknologi dan Bisnis Adias
  • B. T. Sutrisno. SP. Institut Teknologi dan Bisnis Adias
  • Andy Arief Setyawan Institut Teknologi dan Bisnis Adias

DOI:

https://doi.org/10.31294/conten.v4i1.3543

Keywords:

Binary Classification, Logistic Regression, SMS, SPAM, Term Frequency, Inverse Document Frequency

Abstract

Spam biasanya digunakan baik oleh perusahaan maupun perseorangan kepada pelanggannya baik pelanggan lama maupun calon pelanggan untuk memberikan berbagai macam informasi secara terus-menerus. Umumnya informasi yang diberikan adalah promosi produk atau penawaran produk baru. Namun informasi yang diberikan tersebut adalah informasi yang bisa jadi tidak penting sehingga dapat mengganggu orang yang menerima informasi tersebut. Masalah spam ini bisa diantisipasi dengan menciptakan sebuah Machine Learning yang mampu mendeteksi apakah informasi yang masuk itu adalah spam atau bukan dengan melakukan klasifikasi terhadap isi pesan SMS. Karena label yang terdapat pada penelitian ini hanya ada dua variabel, maka penelitian ini menggunakan tipe Binary Classification dengan menerapkan metode Logistic Regression untuk melakukan klasifikasi pesan SMS. Tujuan dalam penelitian ini adalah selain untuk menciptakan sebuah tools pendeteksi spam, penelitian ini juga akan mengdapatkan hasil uji terhadap metode Logistic Regression berdasarkan akurasi pendeteksian yang dapat dicapai. Hasil dari penelitian ini adalah untuk mendapatkan teknik klasifikasi SPAM SMS dengan tingkat akurasi yang tinggi.

References

P. Gerbaudo. 2014. Spam: a shadow history of the internet. Information Communication and Society, 17 (7), doi: 10.1080/1369118x.2013.873475.

B. T. Sutrisno and W. Andriyani. 2021. Penerapan Madm Dengan Metode Saw Untuk Menentukan Target Promosi Berdasarkan Asal Jurusan Di Sekolah. Jurnal Simetris, 11 (2), 480-492, doi: 10.24176/simet.v11i2.4784.

H. Muhrial, B. Purnomosidi.D.P, W. Andriyani, and H. Hamdani. 2022. Data Warehouse to Support the Decision Using Vikor Method. Journal of Intelligent Software Systems, 1 (2), 153-176, doi: 10.26798/jiss.v1i2.767.

R. Zhang and A. Zakhor. 2014. Automatic identification of window regions on indoor point clouds using LiDAR and cameras, doi: 10.1109/WACV.2014.6836112.

Y. Lu and C. Rasmussen. 2012. Simplified markov random fields for efficient semantic labeling of 3D point clouds, doi: 10.1109/IROS.2012.6386039.

S. Menard. 2014. Logistic Regression: From Introductory to Advanced Concepts and Applications.

K. Iriyanta, B. P. D. Putranto, and W. Andriyani. 2023. IOT Based Soil Moisture Monitoring And Soil Moisture Prediction Using Linear Regression (Case Study of Vinca Plants). Journal of Intelligent Software Systems, 2 (1), doi: 10.26798/jiss.v2i1.929.

J. Tolles and W. J. Meurer. 2016. Logistic regression: Relating patient characteristics to outcomes,” JAMA. Journal of the American Medical Association, 316 (5), doi: 10.1001/jama.2016.7653.

A. J. Scott, D. W. Hosmer, and S. Lemeshow. 1991. Applied Logistic Regression. Biometrics, 47 (4), doi: 10.2307/2532419.

M. Pohar, M. Blas, and S. Turk. 2004. Comparison of Logistic Regression and Linear Discriminant Analysis: A Simulation Study. Metodološki zvezki, 1 (1).

J. Han and C. Moraga. 1995. The influence of the sigmoid function parameters on the speed of backpropagation learning,” in Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol. 930, doi: 10.1007/3-540-59497-3_175.

I. Goodfellow, Y. Bengio, and A. Courville. 2016. Deep Learning. MIT Press.

K. P. Murphy. 1991. Machine Learning: A Probabilistic Perspective.

T. Fawcett. 2006. An introduction to ROC analysis. Pattern Recognition Letters, 27 (8), doi: 10.1016/j.patrec.2005.10.010.

Hendra and W. Andriyani. 2010. Studi Komparasi Menyimpan dan Menampilkan Data Histori Antara Database Terstruktur Mariadb dan Database Tidak Terstruktur Influxdb. Jurnal Teknologi Technoscientia, 12 (2), 168-174.

Downloads

Published

2024-06-30

Issue

Section

Articles