[發明專利]利用比對單字位置關系進行全文檢索的系統及其方法無效
| 申請號: | 200710018281.3 | 申請日: | 2007-07-17 |
| 公開(公告)號: | CN101089850A | 公開(公告)日: | 2007-12-19 |
| 發明(設計)人: | 陳淮琰;李重錦 | 申請(專利權)人: | 無敵科技(西安)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 西安通大專利代理有限責任公司 | 代理人: | 李鄭建 |
| 地址: | 710075陜西省西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 單字 位置 關系 進行 全文 檢索 系統 及其 方法 | ||
技術領域
本發明涉及一種全文檢索的系統及其方法,特別是能夠應用于具有辭典功能的手持式數據處理裝置的一種利用比對單字位置關系進行全文檢索的系統及其方法。
背景技術
在現行的電子字典中,對于單字或詞匯的檢索方式大致可分為以下幾種方式。
第一種方式,先將字典中的每筆資料進行資料編號,再根據每一單字出現于那些資料編號中建立一索引文件,索引文件中記錄著每一單字與資料編號的對應關系,當使用者輸入一待檢索的詞匯時,檢索結果便依索引文件的記錄,將包含有詞匯中各單字的資料判定為相關資料,并按排序全部列出,例如,使用者輸入所欲檢索的詞匯為“中國”時,檢索結果中還將出現“國中”、“開發中的國家”等與待檢索詞匯毫不相關的資料,換言之,只要含有“中”及“國”二字的資料均會被判定為高度相關資料,并且在檢索結果中列出。此外,電子字典中的資料通常系以壓縮文件方式儲存,當使用者想要進一步了解檢索結果所列的相關資料中是否真正符合所欲查找的條件時,必須逐筆點選各資料以解壓縮各資料內容,然后再一一檢視。如此一來,不僅影響執行全文檢索的速度更增加使用者額外的負擔,難以滿足使用者進行全文檢索時,快速、省時及精確的要求。
已知的電子辭典全文檢索方式,容易產生非直接相關性的檢索結果,使用者必須針對檢索結果所列出的查詢結果逐筆閱讀,但由于辭典數據庫多以壓縮文件形式儲存資料,因此必須額外耗費解壓縮資料的時間才得以閱讀資料內容,因此,己知的電子辭典檢索方式無法滿足使用者對于精確檢索的要求,并相對地增加不少時間的耗費。
發明內容
針對上述現有技術操作的缺陷或不足,本發明的目的在于,提出一種利用比對單字位置關系進行全文檢索的系統及其方法,特別適用于具有辭典功能的手持式數據處理裝置。
為了實現上述任務,本發明采取如下的技術解決方案:
一種利用比對單字位置關系進行全文檢索的系統,該系統包括手持式數據處理裝置的辭典數據庫,其特征在于,系統還包括有:
一輸入模塊,用于提供使用者輸入待檢索詞匯;
一拆字模塊,用于將所接收的待檢索詞匯拆解成復數個單字;
一檢索模塊,用于依據拆字模塊所拆解出的單字,在索引文件中檢索出符合待檢索詞匯中各單字位置關系的詞匯文件,并生成一檢索結果列表;
一顯示模塊,用于顯示檢索結果并列表;
辭典數據庫分別與輸入模塊和檢索模塊連接,輸入模塊和檢索模塊之間連接有拆字模塊,其中檢索模塊還與顯示模塊相連,顯示模塊與輸入模塊連接。
所述的辭典數據庫中儲存有復數筆詞匯文件及索引文件,各詞匯文件包含有文件編號、位置編號及具有復數個單字的文字資料,索引文件記錄有與各單字相對應的文件編號及位置編號。
所述的檢索模塊還包括有相互連接的文件比對模塊、位置比對模塊及排序模塊;
文件比對模塊依據拆解出單字,在索引文件中比對所對應的文件編號,以找出包含拆解出單字的詞匯文件;
位置比對模塊在包含拆解出單字的詞匯文件中,比對單字的位置編號,以找出符合待檢索詞匯中各單字相對位置的詞匯文件并生成一檢索結果列表;
排序模塊,用以將檢索結果列表依相關程度加以排序。
上述利用比對單字位置關系進行全文檢索的系統的檢索方法,其特征在于,包括下列步驟:
首先,辭典數據庫對復數筆詞匯文件進行編號,使各詞匯文件具有文件編號;然后再對每一筆詞匯文件中的每一個單字進行編號,使每一個單字具有一位置編號;
然后,建立索引文件,該索引文件中記錄各單字所對應的文件編號及位置編號,文件編號與詞匯文件連通;
讀取一待檢索詞匯,將待檢索詞匯拆解成復數個單字,并依據拆解出的單字,自索引文件中比對所對應的文件編號,以找出包含拆解出單字的詞匯文件;
自包含拆解出單字的詞匯文件中比對單字的位置編號,以找出符合待檢索詞匯中各單字相對位置的詞匯文件;
將比對結果以排序方式生成檢索結果列表并進行顯示。
本發明的利用單字相關位置進行全文檢索的系統及方法,不需將辭典數據庫中每一筆資料解壓縮后再執行查找工作,大大節省使用者執行檢索的時間,而且通過單字相關位置以作為檢索資料的判斷,可避免獲得非相關的檢索結果,提高了全文檢索的效率,滿足使用者對于精確檢索的要求。
附圖說明
圖1為本發明的利用比對單字位置關系進行全文檢索系統示意圖;
圖2為本發明的索引文件示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無敵科技(西安)有限公司,未經無敵科技(西安)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710018281.3/2.html,轉載請聲明來源鉆瓜專利網。





