PENERAPAN METODE BAYESIAN DALAM MODEL LATENT DIRICHLET ALLOCATION DI MEDIA SOSIAL
Abstract
Abstrak
Penelitian ini bertujuan untuk mengetahui berita apa yang dominan dibahas di masyarakat pada periode waktu tertentu. Model Latent Dirichlet Allocation (LDA), sebuah model probabilitas dimana akan menghasilkan beberapa macam topik yang berbeda. Diawali dengan mengambil data data tweet dari twitter. Data yang semula vektor diubah menjadi corpus lalu dilakukan pre-processing pada data agar bisa dibentuk model. Selanjutnya pembentukan model pada data dan estimasi parameter yang digunakan adalah metode Bayesian dengan estimasi Gibbs Sampling. Setelah mendapatkan model dari data training maka model tersebut digunakan pada data testing untuk mendapatkan berita yang dominan dibahas di masyarakat. Hasil penelitian menunjukkan nilai loglikehood paling tinggi -1759487 dengan 10 topik dan topik yang dominan dibahas di masyarakat yang diterbitkan @kompascom pada tanggal 11 Mei 2018 sampai 25 Mei 2018 adalah Menyebarkan gambar atau video lokasi bom di Surabaya dapat ikut menyebarkan teror dan ketakutan yang jadi tujuan pelaku bom dengan nilai probabilitas topik 0.10057.
Kata kunci: Media Sosial, twitter, pemodelan topik, Latent Dirichlet Allocation, Bayesian, dan Gibbs Sampling
Abstract
This research aims to find out what news is dominantly discussed in the community for a certain period of time. The Latent Dirichlet Allocation (LDA) model, a probability model which will produce several different topics. Beginning by taking data tweet data from twitter. The original vector data is converted into a corpus and then pre-processing the data to form a model. Furthermore, the formation of model on data and parameter estimation used is Bayesian method with Gibbs Sampling estimation. After getting the model from the training data then the model is used in data testing to get the dominant news discussed in the public. The results of this research showed that the highest loglikehood value -1759487 with 10 topics and topics dominantly discussed in the public published @kompascom on May 11, 2018 until May 25, 2018 is spread the image or video of the location of the bomb in Surabaya can participate in spreading terror and fear of the goal bombers with probability value topic 0.10057.
Keywords: Social Media, twitter, topic modeling, Latent Dirichlet Allocation, Bayesian, and Gibbs Sampling
Full Text:
PDFRefbacks
- There are currently no refbacks.
Online ISSN (e-ISSN): 3031-1152
Jurnal Kajian dan Terapan Matematika by https://journal.student.uny.ac.id/index.php/jktm/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. |