Klasifikasi informasi hoaks pada media sosial twitter menggunakan algoritma random forest berbasis particle swarm optimization
Sahid Sahid, Prodi Matematika FMIPA UNY, Indonesia
Abstract
Twitter merupakan salah satu media sosial yang memiliki peran penting sebagai sarana penyebaran informasi dan berkomunikasi. Maraknya penyebaran informasi hoaks memberikan banyak dampak buruk kepada penggunanya. Untuk mengetahui apakah informasi tersebut hoaks atau bukan diperlukan klasifikasi. Penelitian ini melakukan klasifikasi informasi hoaks dengan menggunakan algoritma Random Forest (RF) berbasis Particle Swarm Optimization (PSO). Data penelitian diambil menggunakan Twitter Application Programming Interface (API) pada rentang waktu November 2021 sampai Februari 2022. Data sampel terdiri atas tiga kategori informasi, yaitu akurat (100 sampel), hoaks yang menyesatkan (50 sampel), dan hoaks yang salah (50 sampel). Data sampel diklasifikasikan setelah melalui tahap text mining, pra proses data, eksplorasi data, pembobotan kata, pembagian data training dan data testing dalam dua perbandingan, yaitu 70% data training dan 30% data testing, dan 80% data training dan 20% data testing. Algoritma yang menghasilkan klasifikasi terbaik adalah RF berbasis PSO dengan tingkat akurasi sebesar 73%, presisi sebesar 66%, dan recall sebesar 65%. Selanjutnya diperoleh beberapa karakteristik informasi hoaks pada data sampel, di antaranya: memiliki jumlah komentar, likes, dan retweet yang tinggi. Topik yang paling sering terpapar hoaks pada data sampel adalah politik (24 sampel), kriminal dan kesehatan (21 sampel), dan terkini (20 sampel). Kata-kata pada data sampel tweet yang paling sering terpapar hoaks adalah “sebar”, “hati”, dan “buzzer”.
Full Text:
PDFReferences
Afriza, A., & Adisantoso, J. (2018). Metode Klasifikasi Rocchio untuk Analisis Hoax. Jurnal Ilmu Komputer dan Agri-Informatika, 5(1), 1–10. https://doi.org/10.29244/jika.5.1.1-10
Amalia, Hilda; Lestari, A. F. P., & Ari. (2017). Penerapan Metode SVM Berbasis PSO Untuk Penentuan Kebangkrutan Perusahaan. Techno Nusa Mandiri, 14, 131–136.
Amir, R. F., Sobari, I. A., & Rousyati, R. (2020). Penerapan PSO Over Sampling Dan Adaboost Random Forest Untuk Memprediksi Cacat Software. Indonesian Journal on Software Engineering (IJSE), 6(2), 230–239. https://doi.org/10.31294/ijse.v6i2.9258
Hootsuite. (2022). Favourite Social Media Platforms in 2022 [Set data]. Diambil dari https://datareportal.com/social-media-users
Jian, Jiawei, P., Micheline, H., & Kamber. (2012). Data Mining : Concepts and Techniques (Third Edit). Waltham: Elsevier B.V.
Nurhayati, N., & Pasaribu, A. (2020). Perancangan Sistem Pendeteksi Berita Hoax Menggunakan Algoritma Levenshtein Distance Berbasis Php. Jurnal SAINTIKOM (Jurnal Sains Manajemen Informatika dan Komputer), 19(2), 74–84. https://doi.org/10.53513/jis.v19i2.2601
Prasetijo, A. B., Isnanto, R. R., Eridani, D., Soetrisno, Y. A. A., Arfan, M., & Sofwan, A. (2017). Hoax Detection System on Indonesian News Sites Based on Text Classification Using SVM and SGD. Proceedings - 2017 4th International Conference on Information Technology, Computer, and Electrical Engineering, ICITACEE 2017, 2018-Janua, 45–49. https://doi.org/10.1109/ICITACEE.2017.8257673
Rodiyansyah, S. F., & Winarko, E. (2012). Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification. Indonesian Journal of Computing and Cybernetics Systems (IJCCS), 6(1), 91–100. https://doi.org/10.1163/ej.9789004182127.i-302.6
Statista. (2021). Social Media in Indonesia [Set data]. Diambil dari https://www.statista.com/topics/8306/social-media-in-indonesia
Refbacks
- There are currently no refbacks.
Online ISSN (e-ISSN): 3031-1152
Jurnal Kajian dan Terapan Matematika by https://journal.student.uny.ac.id/index.php/jktm/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. |