Compressed Full-Text Indexing

Keyword(s):  
Author(s):  
Jason Strate ◽  
Grant Fritchey
Keyword(s):  

2017 ◽  
Vol 65 (4) ◽  
pp. 407-418
Author(s):  
S. Grabowski ◽  
M. Raniszewski

AbstractFull-text indexing aims at building a data structure over a given text capable of efficiently finding arbitrary text patterns, and possibly requiring little space. We propose two suffix array inspired full-text indexes. One, called SA-hash, augments the suffix array with a hash table to speed up pattern searches due to significantly narrowed search interval before the binary search phase. The other, called FBCSA, is a compact data structure, similar to Mäkinen’s compact suffix array (MakCSA), but working on fixed size blocks. Experiments on the widely used Pizza & Chili datasets show that SA-hash is about 2–3 times faster in pattern searches (counts) than the standard suffix array, for the price of requiring 0.2n–1.1nbytes of extra space, wherenis the text length. FBCSA, in one of the presented variants, reduces the suffix array size by a factor of about 1.5–2, while it gets close in search times, winning in speed with its competitors known from the literature, MakCSA and LCSA.


Author(s):  
Shuigeng Zhou ◽  
Jihong Guan ◽  
Yunfa Hu ◽  
Jiangtao Hu ◽  
Aoying Zhou

2014 ◽  
Vol 8 (1) ◽  
pp. 321-326 ◽  
Author(s):  
Wei-Zhe Zhang ◽  
Hui-Xiang Chen ◽  
Hui He ◽  
Gui Chen

1989 ◽  
Vol 23 (SI) ◽  
pp. 198-206 ◽  
Author(s):  
Y. S. Maarek ◽  
F. Z. Smadja

2012 ◽  
Author(s):  
Darshan Karia
Keyword(s):  

2019 ◽  
Vol 14 (2) ◽  
pp. 72
Author(s):  
Yessy Prima Putri ◽  
Ridwan Lawson

Pada proses pengerjaan tugas akhir atau skripsi, mahasiswa STMIK Indonesia Padang sering sekali melakukan kesalahan penulisan dalam hal pengetikan dan pengetahuan yang kurang terhadap penulisan ejaan dan padanan kata yang paling update dan sesuai dengan KBBI. Kesalahan yang sering terjadi adalah kurangnya pengetahuan mahasiswa akan penulisan ejaan yang baku, kelalaian mahasiswa yang tidak disengaja, kesalahan pengaturan aplikasi yang digunakan untuk media pengetikan (Microsoft Word, Notepad, Open Office Word) dan beberapa hal lainnya. Aplikasi deteksi kesalahan penulisan skripsi merupakan solusi untuk membantu mahasiswa dalam membuat skripsi dan mendeteksi kesalahan penulisan dokumen skripsi. Salah satu metode indexing untuk meng-indeks teks biasa, untuk mengurangi kapasitas pemakaian storage dan meningkatkan kinerja searching adalah Full Text Indexing. Full Text Indexing merupakan metode yang digunakan dalam mencari kesalahan dalam sebuah teks sebagai alat bantu utama dalam perancangan aplikasi ini. Pada metode Full Text Indexing terdapat 2 tahap yang dilakukan sebelum dilakukan pencarian kata, yaitu tahap tokenizing dan tahap cleansing. Aplikasi deteksi kesalahan penulisan naskah dokumen skripsi dibuat dengan fitur pengecekan kesalahan penulisan dan penyimpanan daftar pustaka dan daftar gambar. Dengan dibuatnya aplikasi ini diharapkan bisa membantu mahasiswa dalam pembuatan skripsi, terutama dalam pengecekan kesalahan penulisan skripsi.


Sign in / Sign up

Export Citation Format

Share Document