Klasifikasi informasi hoaks pada media sosial twitter menggunakan algoritma random forest berbasis particle swarm optimization

Taqiyudin Muhammad Khalil, Prodi Matematika FMIPA UNY, Indonesia
Sahid Sahid, Prodi Matematika FMIPA UNY, Indonesia

Abstract


Twitter merupakan salah satu media sosial yang memiliki peran penting sebagai sarana penyebaran informasi dan berkomunikasi. Maraknya penyebaran informasi hoaks memberikan banyak dampak buruk kepada penggunanya. Untuk mengetahui apakah informasi tersebut hoaks atau bukan diperlukan klasifikasi. Penelitian ini melakukan klasifikasi informasi hoaks dengan menggunakan algoritma Random Forest (RF) berbasis Particle Swarm Optimization (PSO). Data penelitian diambil menggunakan Twitter Application Programming Interface (API) pada rentang waktu November 2021 sampai Februari 2022. Data sampel terdiri atas tiga kategori informasi, yaitu akurat (100 sampel), hoaks yang menyesatkan (50 sampel), dan hoaks yang salah (50 sampel). Data sampel diklasifikasikan setelah melalui tahap text mining, pra proses data, eksplorasi data, pembobotan kata, pembagian data training dan data testing dalam dua perbandingan, yaitu 70% data training dan 30% data testing, dan 80% data training dan 20% data testing. Algoritma yang menghasilkan klasifikasi terbaik adalah RF berbasis PSO dengan tingkat akurasi sebesar 73%, presisi sebesar 66%, dan recall sebesar 65%. Selanjutnya diperoleh beberapa karakteristik informasi hoaks pada data sampel, di antaranya: memiliki jumlah komentar, likes, dan retweet yang tinggi. Topik yang paling sering terpapar hoaks pada data sampel adalah politik (24 sampel), kriminal dan kesehatan (21 sampel), dan terkini (20 sampel). Kata-kata pada data sampel tweet yang paling sering terpapar hoaks adalah “sebar”, “hati”, dan “buzzer”.


Full Text:

PDF

References


Afriza, A., & Adisantoso, J. (2018). Metode Klasifikasi Rocchio untuk Analisis Hoax. Jurnal Ilmu Komputer dan Agri-Informatika, 5(1), 1–10. https://doi.org/10.29244/jika.5.1.1-10

Amalia, Hilda; Lestari, A. F. P., & Ari. (2017). Penerapan Metode SVM Berbasis PSO Untuk Penentuan Kebangkrutan Perusahaan. Techno Nusa Mandiri, 14, 131–136.

Amir, R. F., Sobari, I. A., & Rousyati, R. (2020). Penerapan PSO Over Sampling Dan Adaboost Random Forest Untuk Memprediksi Cacat Software. Indonesian Journal on Software Engineering (IJSE), 6(2), 230–239. https://doi.org/10.31294/ijse.v6i2.9258

Hootsuite. (2022). Favourite Social Media Platforms in 2022 [Set data]. Diambil dari https://datareportal.com/social-media-users

Jian, Jiawei, P., Micheline, H., & Kamber. (2012). Data Mining : Concepts and Techniques (Third Edit). Waltham: Elsevier B.V.

Nurhayati, N., & Pasaribu, A. (2020). Perancangan Sistem Pendeteksi Berita Hoax Menggunakan Algoritma Levenshtein Distance Berbasis Php. Jurnal SAINTIKOM (Jurnal Sains Manajemen Informatika dan Komputer), 19(2), 74–84. https://doi.org/10.53513/jis.v19i2.2601

Prasetijo, A. B., Isnanto, R. R., Eridani, D., Soetrisno, Y. A. A., Arfan, M., & Sofwan, A. (2017). Hoax Detection System on Indonesian News Sites Based on Text Classification Using SVM and SGD. Proceedings - 2017 4th International Conference on Information Technology, Computer, and Electrical Engineering, ICITACEE 2017, 2018-Janua, 45–49. https://doi.org/10.1109/ICITACEE.2017.8257673

Rodiyansyah, S. F., & Winarko, E. (2012). Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification. Indonesian Journal of Computing and Cybernetics Systems (IJCCS), 6(1), 91–100. https://doi.org/10.1163/ej.9789004182127.i-302.6

Statista. (2021). Social Media in Indonesia [Set data]. Diambil dari https://www.statista.com/topics/8306/social-media-in-indonesia


Refbacks

  • There are currently no refbacks.


 


Online ISSN (e-ISSN): 3031-1152

Creative Commons LicenseJurnal Kajian dan Terapan Matematika by https://journal.student.uny.ac.id/index.php/jktm/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.