Klasifikasi Analisis Sentimen Meme Dengan Metode Optical Character Recognition (OCR) dan Algoritma Naive Bayes
View/ Open
Date
2018Author
Haisar, Fikri
Advisor(s)
Amalia
Sharif, Amer
Metadata
Show full item recordAbstract
Meme on the image which is the result of production from people that used to comment on an event with a particular template theme from popular online images. The spread of memes become phenomenal and so popular in recent years, start from loaded memes such as memes of joke, memes of quote until heavy memes such as memes of government, memes of education, and recent news. A system th at can classify the type of memes by applying the image process and the OCR Tesseract combined with the Naive bayes algorithm. OCR Tesseract is needed to remove the existing text in an image, meanwhile the Naive Bayes algorithm is an algorithm used to find the probability value to classify the data testing in the most appropriate category. In this study, the data testing is a meme document. The results obtained from this application is the level of accuracy meme classification that is analyzed is 73.3% of the 15 test data and the average classification process time of 1.328 ms . Meme which the accuracy value is depend on the results of the OCR by using a tesseract engine. Meme pada umumnya berbentuk gambar yang merupakan hasil produksi dari rakyat yang digunakan untuk memberikan komentar pada sebuah peristiwa dengan diikuti template tertentu dari gambar-gambar online populer. Penyebaran meme menjadi fenomenal dan begitu populer dalam beberapa tahun terakhir, mulai dari meme yang bermuatan ringan seperti meme tentang candaan, meme quotes hingga meme yang bermuatan berat seperti meme tentang pemerintahan, pendidikan, maupun berita terkini. Sehingga dibuat sistem yang dapat mengklasifikasikan jenis meme kedalam meme negatif atau positif dengan menerapkan image process dan OCR Tesseract yang dikombinasikan dengan algoritma Naive bayes. OCR Tesseract diperlukan untuk mengenali teks yang terdapat pada sebuah gambar, sedangkan Algoritma Naive bayes merupakan algoritma yang digunakan untuk mencari nilai probabilitas tertinggi untuk mengklasifikasi data uji pada kategori yang paling tepat. Dalam penelitian ini yang menjadi data uji adalah dokumen meme. Hasil yang di dapat dari aplikasi ini adalah tingkat akurasi klasifikasi meme yang dianalisis adalah 73,3% dari 15 data uji dan rata-rata waktu proses klasifikasi sebesar 1,328 ms. Meme yang berhasil diklasifikasi nilai akurasinya bergantung dari hasil OCR dengan menggunakan tesseract engine
Collections
- Undergraduate Theses [1171]