KLASIFIKASI TEKS UJARAN KEBENCIAN TERHADAP AGENSI NIJISANJI MENGGUNAKAN ALGORITMA LOGISTIC REGRESSION PADA TWEET BERBAHASA INGGRIS

Penulis

  • Rizky Muhammad Anwar Universitas Budi Luhur
  • Dolly Virgian Shaka Yudha Sakti Universitas Budi Luhur

Kata Kunci:

Klasifikasi Teks, ujaran kebencian, Twitter, VTuber, Analisis Sentimen, Logistic Regression

Abstrak

Twitter adalah platform yang populer untuk berekspresi, namun sering digunakan untuk menyebarkan ujaran kebencian. Agensi virtual Nijisanji, yang menaungi VTuber (Virtual YouTuber), sering menjadi target serangan verbal di platform ini. Penelitian ini bertujuan untuk mengembangkan model klasifikasi teks menggunakan algoritma Logistic Regression guna mendeteksi ujaran kebencian terhadap Nijisanji pada tweet berbahasa Inggris. Data tweet dikumpulkan menggunakan teknik crawling, dilabeli secara manual, dan diproses melalui tahap preprocessing yang mencakup penghapusan duplikasi, tokenisasi, stemming, dan penghapusan stopwords. Setelah preprocessing, fitur teks diekstraksi menggunakan teknik Term Frequency-Inverse Document Frequency (TF-IDF) untuk mengubah teks menjadi representasi vektor yang dapat diolah oleh model. Model Logistic Regression kemudian dilatih menggunakan data yang telah diproses dan dievaluasi menggunakan metrik akurasi, presisi, recall, dan F1-score untuk memastikan efektivitasnya dalam mendeteksi ujaran kebencian. Hasil penelitian menunjukkan bahwa model ini memiliki kemampuan yang baik dalam mengidentifikasi ujaran kebencian terhadap Nijisanji, sehingga dapat membantu mengurangi beban manual dalam moderasi konten di media sosial. Model ini juga diharapkan dapat berkontribusi dalam menciptakan lingkungan digital yang lebih aman dan inklusif bagi semua pengguna. Selain itu, penelitian ini juga membuka peluang untuk mengadaptasi model yang dikembangkan ke berbagai platform media sosial lainnya dan dalam berbagai bahasa untuk mendeteksi ujaran kebencian dan konten negatif lainnya. Dengan demikian, hasil penelitian ini tidak hanya bermanfaat bagi agensi seperti Nijisanji tetapi juga dapat diterapkan secara luas untuk meningkatkan keamanan dan kenyamanan di dunia maya.

Referensi

S. A. Assaidi and F. Amin, “Analisis Sentimen Evaluasi Pembelajaran Tatap Muka 100 Persen pada Pengguna Twitter menggunakan Metode Logistic Regression,” J. Pendidik. Tambusai, vol. 6, no. 2, pp. 13217–13227, 2022.

F. Zahria Emeraldien, R. Jefri Sunarsono, and R. Alit, “Twitter Sebagai Platform Komunikasi Politik Di Indonesia,” J. Teknol. dan Inf., vol. 14, no. 1, pp. 21–30, 2019, [Online]. Available: www.statisticbrain.com

M. Afdal and L. R. Elita, “Penerapan Text Mining Pada Aplikasi Tokopedia Menggunakan Algoritma K-Nearest Neighbor,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., vol. 8, no. 1, p. 78, 2022, doi: 10.24014/rmsi.v8i1.16595.

K. Zuhri and N. A. O. Saputri, “Analisis Sentimen Masyarakat Terhadap Pilpres 2019 Berdasarkan Opini Dari Twitter Menggunakan Metode Naive Bayes Classifier,” J. Comput. Inf. Syst. Ampera, vol. 1, no. 3, pp. 185–199, 2020, doi: 10.51519/journalcisa.v1i3.45.

M. Ridwan and A. Muzakir, “Model Klasifikasi Ujaran Kebencian pada Data Twitter dengan Menggunakan CNN-LSTM,” Teknomatika J. Teknol. Inform., vol. 12, no. 02, pp. 209–218, 2022, [Online]. Available: https://ojs.palcomtech.ac.id/index.php/teknomatika/article/view/604

M. Banurea, D. Betaria Hutagaol, and O. Sihombing, “Klasifikasi Penyakit Stunting Dengan Menggunakan Algoritma Support Vector Machine Dan Random Forest,” J. TEKINKOM, vol. 6, no. 2, pp. 540–549, 2023, doi: 10.37600/tekinkom.v6i2.927.

O. Irnawati and K. Solecha, “Analisis Sentimen Ulasan Aplikasi Flip Menggunakan Naïve Bayes dengan Seleksi Fitur PSO,” J. Ilm. Intech Inf. Technol. J. UMUS, vol. 4, no. 02, pp. 189–199, 2022, doi: 10.46772/intech.v4i02.868.

R. Prabowo, H. Sujaini, and T. Rismawan, “Analisis Sentimen Pengguna Twitter Terhadap Kasus COVID-19 di Indonesia Menggunakan Metode Regresi Logistik Multinomial,” J. Sist. dan Teknol. Inf., vol. 11, no. 2, p. 366, 2023, doi: 10.26418/justin.v11i2.57449.

R. Syahranita and S. Zaman, “Regresi Logistik Multinomial untuk Prediksi Kategori Kelulusan Mahasiswa,” J. Inform. Sunan Kalijaga), vol. 8, no. 2, pp. 102–111, 2023.

D. Marutho, “Perbandingan Metode Naïve Bayes, KNN, Decision Tree Pada Laporan Water Level Jakarta,” J. Ilm. Infokam, vol. 15, no. 2, pp. 90–97, 2019.

Ernianti Hasibuan and Elmo Allistair Heriyanto, “Analisis Sentimen Pada Ulasan Aplikasi Amazon Shopping Di Google Play Store Menggunakan Naive Bayes Classifier,” J. Tek. dan Sci., vol. 1, no. 3, pp. 13–24, 2022, doi: 10.56127/jts.v1i3.434.

Unduhan

Diterbitkan

30-09-2024

Cara Mengutip

Anwar, R. M., & Dolly Virgian Shaka Yudha Sakti. (2024). KLASIFIKASI TEKS UJARAN KEBENCIAN TERHADAP AGENSI NIJISANJI MENGGUNAKAN ALGORITMA LOGISTIC REGRESSION PADA TWEET BERBAHASA INGGRIS. Prosiding Seminar Nasional Mahasiswa Fakultas Teknologi Informasi (SENAFTI), 3(2), 838–845. Diambil dari https://senafti.budiluhur.ac.id/index.php/senafti/article/view/1545