Query Expansion pada Retrieval Berbasis Corpus Content Base Retrieval (CBR) di Media Sosial untuk Meningkatkan Hasil Retrieval

Kaban, Roberto

Query Expansion pada Retrieval Berbasis Corpus Content Base Retrieval (CBR) di Media Sosial untuk Meningkatkan Hasil Retrieval

dc.contributor.advisor	Sihombing, Poltak
dc.contributor.advisor	Efendi, Syahril
dc.contributor.advisor	Lydia, Maya Silvi
dc.contributor.author	Kaban, Roberto
dc.date.accessioned	2026-01-05T08:23:04Z
dc.date.available	2026-01-05T08:23:04Z
dc.date.issued	2025
dc.identifier.uri	https://repositori.usu.ac.id/handle/123456789/111687
dc.description.abstract	The rapid growth of social media data has generated a vast and diverse volume of data. Such data are typically unstructured, written in informal language, contain non-standard abbreviations, and exhibit high content dynamics. These characteristics pose significant challenges for Information Retrieval (IR) systems in producing relevant and accurate search results. This study focuses on improving IR performance in social media, specifically for e-government-related queries concerning Indonesia’s National Health Insurance (BPJS Kesehatan) collected from the Twitter (X) platform. Conventional IR models often struggle to handle unstructured content with informal language and abbreviations, leading to low retrieval accuracy. To address this issue, this research proposes a hybrid Query Expansion (QE) model called ROCBERT-QE, which integrates Corpus Content-Based Retrieval (CBR) with Bidirectional Encoder Representations from Transformers (BERT). The ROCBERT-QE model introduces a dual expansion mechanism in which corpus-based co-occurrence captures lexical relationships, while BERT embeddings preserve semantic meaning and contextual information. A domain-specific corpus comprising 5,017 preprocessed tweets related to Indonesia’s National Health Insurance (BPJS) was constructed, containing 6,215 unique terms that represent linguistic variations and informality within public discourse. Experimental results demonstrate that ROCBERT-QE outperforms baseline retrieval methods such as TF-IDF, BM25, and standard BERT. For single-word queries, the model achieved a Recall of 0.8574 and a Precision of 0.8807, while for sentence-based queries, Recall reached 0.8932 and Precision 0.9175. These improvements are attributed to the synergy between frequency-based expansion and deep contextual embeddings, which enable the model to effectively handle lexical noise and semantic ambiguity. The findings highlight the scientific potential of combining corpus-based and transformer-based approaches in IR tasks involving unstructured content. Practically, ROCBERT-QE can be applied to real-time analysis of public discourse in e-government contexts, such as service evaluation, policy feedback, and early detection of public issues. This framework is scalable and adaptable to other domains that feature informal or multilingual data characteristics.	en_US
dc.language.iso	id	en_US
dc.publisher	Universitas Sumatera Utara	en_US
dc.subject	Information Retrieval	en_US
dc.subject	Query Expansion	en_US
dc.subject	Corpus-based Retrieval	en_US
dc.subject	BERT	en_US
dc.subject	Social media	en_US
dc.subject	E-government	en_US
dc.subject	Health Insurance	en_US
dc.title	Query Expansion pada Retrieval Berbasis Corpus Content Base Retrieval (CBR) di Media Sosial untuk Meningkatkan Hasil Retrieval	en_US
dc.title.alternative	Query Expansion in Corpus Content-Based Retrieval (CBR) on Social Media to Improve Retrieval Performance	en_US
dc.type	Thesis	en_US
dc.identifier.nim	NIM228123017
dc.identifier.nidn	NIDN0017036205
dc.identifier.nidn	NIDN0010116706
dc.identifier.nidn	NIDN0027017403
dc.identifier.kodeprodi	KODEPRODI55001#Ilmu Komputer
dc.description.pages	153 Pages	en_US
dc.description.type	Disertasi Doktor	en_US
dc.subject.sdgs	SDGs 9. Industry Innovation And Infrastructure	en_US

Files in this item

Name:: Query Expansion pada Retrieval ...
Size:: 1.062Mb
Format:: PDF
Description:: Cover

View/Open

Name:: Roberto Kaban_Query Expansion ...
Size:: 4.056Mb
Format:: PDF
Description:: Fulltext

View/Open

This item appears in the following Collection(s)

Doctoral Dissertations [67]
Disertasi

Show simple item record

Query Expansion pada Retrieval Berbasis Corpus Content Base Retrieval (CBR) di Media Sosial untuk Meningkatkan Hasil Retrieval

Files in this item

This item appears in the following Collection(s)

Related items

Content Based Video Retrieval Menggunakan Metode Haar Wavelet Transform ﻿

Implementasi Content Based Video Retrieval Menggunakan Metode Block Truncation Algorithm ﻿

Optimasi Sistem Pencarian Karya Ilmiah dari Repositori Institusi USU Berbasis Large Language Model (LLM) dengan Retrieval-Augmented Generation (RAG) ﻿

Content Based Video Retrieval Menggunakan Metode Haar Wavelet Transform

Implementasi Content Based Video Retrieval Menggunakan Metode Block Truncation Algorithm

Optimasi Sistem Pencarian Karya Ilmiah dari Repositori Institusi USU Berbasis Large Language Model (LLM) dengan Retrieval-Augmented Generation (RAG)