Show simple item record

dc.contributor.advisorGunawan, Dani
dc.contributor.advisorNababan, Erna Budhiarti
dc.contributor.authorRiady, Aggie Wicita Rini
dc.date.accessioned2019-06-25T07:35:04Z
dc.date.available2019-06-25T07:35:04Z
dc.date.issued2019
dc.identifier.urihttp://repositori.usu.ac.id/handle/123456789/15418
dc.description72 Halamanen_US
dc.description.abstractSeiring dengan berkembangnya teknologi, khususnya micro-blogging, twitter menjadi salah satu sistem micro-blogging yang popular di kalangan masyarakat. Twitter sudah menjadi wadah dimana semua orang dengan bebas berbagi aktivitas, pengalaman ataupun perasaan mereka secara mudah, kapanpun dan di manapun secara real time, tanpa harus memperhatikan penulisan teks apakah itu benar atau tidak benar. Penggunaan bahasa secara kasual menghasilkan bentuk teks baru yang sangat berbeda dari teks yang ditulis dengan baik disebut dengan mikroteks (Ellen, 2011). Mikroteks dapat mempengaruhi kualitas teks yang sebenarnya. Oleh karena itu diperlukan suatu pemrosesan teks secara otomatis dengan melakukan normalisasi teks. Pada penelitian ini dilakukan normalisasi untuk menormalkan kata yang tidak baku menjadi kata baku dengan acuan kamus Bahasa Indonesia menggunakan algoritma jaro-winkler distance dan rule based. Kata yang dinormalisasi berdasarkan phonetic. Algoritma jaro akan melakukan proses normalisasi menggunakan tingkat kedekatan 2 buah string, selanjutnya apabila sistem tidak menghasilkan output maka akan dilakukan normalisasi dengan menggunakan rule based. Salah satu output yang dihasilkan dari penelitian ini yaitu menghilangkan huruf ganda, seperti kata “ayoooo” menjadi “ayo”. Akurasi yang dihasilkan dengan menggunakan data sebanyak 400 tweet pada penelitian ini sebesar 94% dengan nilai presisi 96%, recall 96%, dan f-score 0.96.en_US
dc.description.abstractAlong with the development of technology, especially micro-blogging, Twitter has become one of the popular micro-blogging systems among the society. Twitter has become a place where everyone freely shares their activities, experiences or feelings easily, anytime and anywhere in real time, without having to notice the writing of their own text whether it is in a correct form or incorrect. The use of language casually that produces new text forms and very different from well-written texts called microtext (Ellen, 2011). Microtext can affect the quality of the actual text. Therefore, we need an automatic text processing by normalizing the text. In this study, normalization has done to normalize non-standard words into standard words by using reference from the Indonesian Language dictionary with the jaro-winkler distance algorithm and rule based. The normalization of the word was based on phonetic. Jaro's algorithm will do the normalization process using the level of proximity of 2 strings. Afterward, if the system does not produce output, it will be normalized using rule based. One of the output that produced from this study is removing double letters, for example like "ayoooo" will be change to "ayo". Accuracy produced by using data contains 400 tweets in this study amounted to 94% with a value of 96% of precision, 96% of recall, and 0.96 of f-score.en_US
dc.language.isoiden_US
dc.publisherUniversitas Sumatera Utaraen_US
dc.subjectNormalisasien_US
dc.subjectMikroteksen_US
dc.subjectTwitteren_US
dc.subjectJaro-Winkler Distanceen_US
dc.subjectRule Baseden_US
dc.titleNormalisasi Mikroteks Berdasarkan Phonetic pada Twitter Berbahasa Indonesia Menggunakan Algoritma Jaro-Winkler Distance dan Rule Baseden_US
dc.typeSkripsi Sarjanaen_US
dc.identifier.nimnipnik141402028


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record