dc.contributor.advisor | Amalia | |
dc.contributor.advisor | Hardi, Sri Melvani | |
dc.contributor.author | Marpaung, Sari Wahyuni | |
dc.date.accessioned | 2020-02-17T01:40:05Z | |
dc.date.available | 2020-02-17T01:40:05Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | http://repositori.usu.ac.id/handle/123456789/24051 | |
dc.description.abstract | Selama ini telah banyak program yang dapat membantu pengguna mendeteksi kesalahan pengetikan kata pada dokumen berbahasa Indonesia, namun saran perbaikan kata yang ditampilkan oleh sistem tidak semua memberikan pilihan kata yang relevan bahkan seringkali jauh dari topik dokumen. Penelitian ini menerapkan kombinasi antara algoritma Levenshtein untuk memeriksa kesalahan kata dan metode pembobotan kata (term weighting) untuk mengidentifikasi topik dokumen sebelum dilakukan proses pengecekan kata. Dengan demikian pencocokan kata (string matching) dijalankan menggunakan perbendaharaan basis data korpus yang disesuaikan dengan topik dokumen. Kategori topik yang disediakan terdiri atas tiga bidang yaitu bidang komputer, kesehatan, dan politik. Metode perhitungan pembobotan kata (term weighting) yang digunakan untuk mengidentifikasi topik dokumen ialah term frequency (TF) melalui model pendekatan bag of words. Analisis akurasi saran perbaikan kata dilakukan dengan membandingkan jumlah saran kata yang muncul dan kesesuaian isi saran dengan apa yang dimaksud oleh user saat dokumen tidak mengalami klasifikasi topik maupun saat topik dokumen mengalami klasifikasi melalui metode term weighting. Dari hasil penelitian diperoleh bahwa terdapat peningkatan akurasi saran perbaikan kata baik dari segi jumlah saran yang semakin dipersempit maupun ketepatan isi saran dengan kata yang dimaksud user sebanyak 58% jika pemeriksaan kata dilakukan dengan menyesuaikan penerapan basis data korpus berdasarkan topik dokumen melalui hasil proses klasifikasi topik dokumen. | en_US |
dc.description.abstract | There have been many programs that can help users detect word typing errors on Indonesian documents, but the word suggestions do not all provide relevant word choices even often far from the topic of the document. This research applies a combination of the Levenshtein algorithm to check word errors with the term weighting method to identify the topic of the document before checking the words. Thus string matching is run by using the corpus database which is based on the topic of the document. The topic categories provided consist of three fields, which are the fields of computer, medical, and politic. Term weighting calculation method that used to identify document’s topic is term frequency (TF) through the bag of words approach. Accuracy analysis of word suggestions is based on the number of word suggestions appearing and the content suitability to the user's meaning by comparing the unclassified topic document and the classified topic document through the term weighting method. The result of the research is proven that there is an increase of the word suggestions accuracy both in narrowing of word suggestions number and increasing of word suggestions suitability to the user’s meaning about 58% by using corpus which is relevant to the document’s topic through the process of classifying document by term weighting method. | en_US |
dc.language.iso | id | en_US |
dc.publisher | Universitas Sumatera Utara | en_US |
dc.subject | Levenshtein | en_US |
dc.subject | Term Weighting | en_US |
dc.subject | Bahasa Indonesia | en_US |
dc.title | Analisis Akurasi Saran Perbaikan Kata pada Dokumen Berbahasa Indonesia dengan Algoritma Levenshtein Sesuai Topik Dokumen Menggunakan Metode Term Weighting | en_US |
dc.type | Thesis | en_US |
dc.identifier.nim | NIM131401118 | |
dc.description.pages | 95 Halaman | en_US |
dc.description.type | Skripsi Sarjana | en_US |