Pengklarifikasian Dokumen PDF Menggunakan Fungsi Cosine untuk Pencarian Informasi

Jeremy Jonathan

Abstract


Dalam pengklasifikasian informasi dokumen kita dapat menggunakan sistem temu kembali informasi (Information Retrieval). Information Retrieval (IR) adalah proses dimana pengumpulan data diwakili, disimpan, dan mencari tujuan penemuan pengetahuan sebagai tanggapan atas permintaan pengguna (query). Penuangan informasi dalam bentuk teks untuk sebuah materi atau ulasan yang dibahas dapat dituangkan dalam berbagai bentuk gaya ulasan yang berbeda, dikarenakan adanya perbedaan gaya mengulas untuk suatu ulasan atau topik pada dokumen maka membutuhkan waktu relatif lebih lama untuk memahami materi dokumen tersebut serta mengklasifikannya. Hal ini menyebabkan sulitnya bagi pengembang sistem untuk membuat sebuah sistem yang mampu memahami isi materi atau topik dari sebuah dokumen secara tepat. Untuk memecahkan masalah tersebut penulis menggunakan salah satu model information retrieval yaitu vector space model dengan algoritma K-NN dan Stemming nazief adriani dengan pembobotan frekuensi kata ( 15logfin"> ) dalam dokumen serta fungsi kesamaan cosine. Hasil efektifitas yang didapat pada penelitian ini dalam hal meninjau efektifitas penggunaan pembobotan frekuensi kata ( 15logfin"> ) dalam dokumen pada vector space model dengan fungsi similarity cosine. Dari hasil pengujian tersebut didapat nilai K=5 adalah 93.33% untuk precision dan 54.67% untuk recall. Dan nilai K=3 adalah 96.33% untuk precision dan 66.67% untuk recall.

Full Text:

PDF

References


Alamin, Z. 2015, Mesin Pencari Dokumen Teks Bahasa Indonesia, Studi Efektifitas Pencarian Pada Vector Space Model, Algoritma Stemming Porter, Pembobotan Frekuensi Term Serta Fungsi Jaccard, Tesis, M.KOM, Universitas Budi Luhur, Jakarta.

Asian dan Jelita. 2007, Effective Techniques for Indonesian Text Retrieval, Ph.D. diss., School of Computer Science and Information Technology, RMIT University, Australia.

Jitendra and Sanjay. 2012, Analysis of Vector Space Model in information retrieval, IJCA.

Kent, A. 1971, Information Analysis and Retrieval, 3 rd Edition, Becker and Heys, New York.

Lancaster, F. dan Wilfrid. 1979, Information Retrieval Systems: Characteristics, Testing and Evaluation, 2nd ed., New York: Jon Wiley & Sons.

Mandala, Rila dan Setiawan, Hendra. 2002, Peningkatan Performansi Sistem Temu-Kembali Informasi dengan Perluasan Query Secara Otomatis, Departemen Teknik Informatika, Institut Teknologi Bandung, Bandung.

Manish dan Rahul. 2013, A Survey On Information Retrieval Models, Technique And Application, IJETAE.

Ramlan, M. 1983, Morfologi Suatu Tinjauan Deskriptif,CV.Karyono, Yogyakarta.

Turney, P.D. & Pantel, P. 2010, From Frequency to Meaning: Vector Space Models of Semantics, Journal of Artificial Intelligence Research. 37:141-188.




DOI: http://dx.doi.org/10.30813/.v1i1.1140

Refbacks

  • There are currently no refbacks.


ISSN: 2620-7907


View My Stats