IMPLEMENTASI WEB SCRAPING UNTUK ULASAN PADA TWITTER MENGGUNAKAN ASOSIASI TEKS (STUDI KASUS: FILM KKN DI DESA PENARI)

  • Frans Xavier Natalius Antoni Universitas Tanjungpura
  • Neva Satyahadewi Universitas Tanjungpura
  • Hendra Perdana Universitas Tanjungpura
Keywords: Asosiasi Teks, Text Preprocessing, Twitter, Ulasan, Web Scraping

Abstract

Pengguna twitter biasanya memberikan komentar yang berisi mengenai ulasan suatu film yang sedang tayang. Teknik yang dapat digunakan untuk mengambil komentar pada twitter yaitu Web Scraping. Penelitian ini bertujuan untuk mengimplementasikan Web Scraping dalam mengumpulkan data pada twitter dan mengimplementasikan Asosiasi Teks untuk mendapatkan informasi antar kata yang terbentuk. Penelitian ini menggunakan komentar yang berisi mengenai ulasan Film KKN di Desa Penari pada tanggal 30 April 2022. Komentar yang diperoleh tidak semua berisi ulasan, sehingga perlu dilakukan seleksi terhadap komentar tersebut. Hasil seleksi dari 866 komentar diperoleh sebanyak 116 ulasan positif dan 83 ulasan negatif. Data yang diperoleh dari komentar tidak bisa langsung dianalisis, sehingga perlu melalui tahap text preprocessing. Adapun tahap text preprocessing yaitu cleansing data, case folding, spelling normalization, filtering, dan tokenizing. Setelah melalui tahap text preprocessing, ulasan tersebut kemudian dianalisis untuk mendapatkan informasi yang penting dengan menggunakan Asosiasi Teks. Hasil Asosiasi Teks untuk ulasan positif diperoleh informasi bahwa penonton memberikan penilaian terhadap tokoh, akting dan sinematografi yang bagus, kemudian film yang ditayangkan juga sesuai dengan cerita thread pada twitter, dan sinematografi juga keren. Sedangkan untuk ulasan negatif penonton memberikan penilaian bahwa Film KKN di Desa Penari, film yang biasa dan hantu yang ditayangkan juga kurang seram.

Downloads

Download data is not yet available.

References

TiNewss.com, “Jumlah Pengguna Twitter di Indonesia pada 2022.” Accessed: Sep. 12, 2022. [Online]. Available: https://www.tinewss.com/indonesia-news/pr-1853618409/jumlah-pengguna-twitter-di-indonesia-pada-2022

I. B. N. W. Manuaba, G. R. Dantes, and G. Indrawan, “Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine (SVM) Dengan Penambahan Algoritma Levenshtein Distance,” Jurnal Sistem Komputer dan Kecerdasan Buatan, vol. 5, no. 2, pp. 9–17, 2022.

S. Fransiska and Yolanda, “Analisis Sentimen Twitter Untuk Review Film Menggunakan Algoritma Naive Bayes Classifier (NBC) Pada Sentimen R Programming,” Jurnal Siliwangi Seri Sains dan Teknologi, vol. 5, no. 2, pp. 68–71, 2019.

D. D. Ayani, H. S. Pratiwi, and H. Muhardi, “Implementasi Web Scraping untuk Pengambilan Data pada Situs Marketplace,” Jurnal Sistem dan Teknologi Informasi, vol. 7, no. 4, pp. 257–262, 2019.

R. Feldman and J. Sanger, The text mining handbook: advanced approaches in analyzing unstructured data. New York: Cambridge University Press, 2007.

E. B. Santoso and A. Nugroho, “Analisis Sentimen Calon Presiden Indonesia 2019 Berdasarkan Komentar Publik di Facebook,” Jurnal Eksplora Informatika, vol. 9, no. 1, pp. 60–69, Sep. 2019, doi: 10.30864/eksplora.v9i1.254.

S. Fide, Suparti, and Sudarno, “Analisis Sentimen Ulasan Aplikasi Tiktok Di Google Play Menggunakan Metode Support Vector Machine (Svm) Dan Asosiasi,” Jurnal Gaussian, vol. 10, no. 3, pp. 346–358, 2021, [Online]. Available: https://ejournal3.undip.ac.id/index.php/gaussian/

F. F. Rahanto and I. Kharisudin, “Analisis Sentimen Data Ulasan Menggunakan Metode Naive Bayes Studi Kasus The Wujil Resort & Conventions pada Situs Tripadvisor,” UNNES Journal of Mathematics, vol. 10, no. 1, pp. 56–62, 2021.

J. Han and M. Kamber, Data Mining: Concepts and Techniques, 2nd ed. San Francisco: Morgan Kaufmann, 2006.

D. Alita and A. Rahman, “Pendeteksian Sarkasme pada Proses Analisis Sentimen Menggunakan Random Forest Classifier,” Jurnal Komputasi, vol. 8, no. 2, pp. 50–58, 2020.

D. P. Santoso and W. Wibowo, “Analisis Sentimen Ulasan Aplikasi Buzzbreak Menggunakan Metode Naïve Bayes Classifier pada Situs Google Play Store,” Jurnal Sains dan Seni ITS, vol. 11, no. 2, pp. 2337–3520, 2022.

S. Juniarsih, E. F. Ripanti, and E. E. Pratama, “Implementasi Naive Bayes Classifier pada Opinion Mining Berdasarkan Tweets Masyarakat Terkait Kinerja Presiden dalam Aspek Ekonomi,” Jurnal Sistem dan Teknologi Informasi (Justin), vol. 8, no. 3, p. 239, Jul. 2020, doi: 10.26418/justin.v8i3.39118.

N. S. Wardani, A. Prahutama, and P. Kartikasari, “Analisis Sentimen Pemindahan Ibu Kota Negara Dengan Klasifikasi Naïve Bayes Untuk Model Bernoulli Dan Multinomial,” Jurnal Gaussian, vol. 9, no. 3, pp. 237–246, 2020, [Online]. Available: https://ejournal3.undip.ac.id/index.php/gaussian/

C. A. DePaolo and K. Wilkinson, “Get Your Head Into the Clouds: Using Word Clouds for Analyzing Qualitative Assessment Data,” Journal TechTrends, vol. 58, no. 3, pp. 38–44, 2014.

F. S. Pamungkas and I. Kharisudin, “Analisis Sentimen dengan SVM, Naïve Bayes, dan KNN untuk Studi Tanggapan Masyarakat Indonesia Terhadap Pandemi Covid-19 pada Media Sosial Twitter,” PRISMA (Prosiding Seminar Nasional Matematika), vol. 4, pp. 628–634, 2021.

A. Novianti and E. Elisa, “Penentuan Aturan Asosiasi Pola Pembelian pada Minimarket dengan Algoritma Apriori,” Technology and Science (BITS), vol. 2, no. 1, pp. 64–70, 2020.

S. Nugroho, S. Akbar, and R. Vusvitasari, “Kajian Hubungan Koefisien Korelasi Pearson (r), Spearman-rho (ρ), Kendall-Tau (τ), Gamma (G), dan Somers (dxy),” Jurnal Gradien, vol. 4, no. 2, pp. 372–381, 2008.

M. Nurwahid, “Korelasi Antara Motivasi Belajar Siswa dalam Pembelajaran Online dengan Hasil Belajar Matematika di Masa Pandemi,” Jurnal Cendekia: Jurnal Pendidikan Matematika, vol. 05, no. 02, pp. 1127–1137, 2021.

D. Dewanti, Suparti, and A. Prahutama, “Pemodelan Indeks Harga Saham Gabungan (IHSG) dan Jakarta Islamic Index (JII) Menggunakan Regresi Birespon Spline Truncated Berbasis GUI R,” Statistika, vol. 8, no. 2, pp. 134–143, 2020.

Published
2024-04-30