[發明專利]中文信息檢索方法、中文信息檢索引擎及嵌入式終端有效
| 申請號: | 200910235592.4 | 申請日: | 2009-09-29 |
| 公開(公告)號: | CN102033891A | 公開(公告)日: | 2011-04-27 |
| 發明(設計)人: | 吳躍進 | 申請(專利權)人: | 高德軟件有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中文 信息 檢索 方法 引擎 嵌入式 終端 | ||
1.一種中文信息檢索方法,其特征在于,所述方法包括:
接收檢索關鍵字的全拼組合,若所述全拼組合是接收的第一個全拼組合,則
從所述全拼組合中提取聲母的首字母及韻母;
在預置的二級檢索索引集中,檢索所述首字母對應的起始偏移量;
在一級檢索索引集中所述起始偏移量對應的位置開始,檢索所述首字母和韻母構成的拼音對應的起始偏移量和終止偏移量;
從預置的檢索索引集中,讀取所述起始偏移量到終止偏移量之間的全拼索引記錄,每條全拼索引記錄包括:目標中文信息全拼組合序列及目標中文信息偏移量;
判斷所述檢索關鍵字的全拼組合與目標中文信息全拼組合序列中的第一個全拼組合是否相同,如果相同,則
根據所述目標中文信息偏移量,從預置的目標中文信息索引集中,檢索目標中文信息。
2.如權利要求1所述的方法,其特征在于,所述方法進一步包括:
將檢索到的目標中文信息及目標中文信息全拼組合序列作為一條檢索結果,添加到第一檢索結果集中。
3.如權利要求2所述的方法,其特征在于,若所述全拼組合是第i個全拼組合,則所述方法進一步包括:
從第i-1檢索結果集的檢索結果中,讀取目標中文信息全拼組合序列;
若第i-1個全拼組合是所述目標中文信息全拼組合序列中第j個分詞的結尾,則
判斷第i個全拼組合與目標中文信息全拼組合序列中第j+1個分詞的第一個全拼組合序列是否相同,如果相同,則將所述檢索結果添加到第i檢索結果集中;
其中,i為大于等于2的自然數,j為大于等于1的自然數。
4.如權利要求3所述的方法,其特征在于,若第i-1個全拼組合是所述目標中文信息全拼組合序列中第j個分詞的第k個全拼組合,則所述方法進一步包括:
判斷第i個全拼組合與第j個分詞中第k+1個全拼組合是否相同,如果相同,則將所述檢索結果添加到第i檢索結果集中。
5.如權利要求1-4中任一項權利要求所述的方法,其特征在于,所述方法進一步包括:
從目標中文信息索引集中,讀取目標中文信息,對所述目標中文信息進行分詞,獲得n個分詞;
解析構成目標中文信息每個漢字的拼音,獲取所述拼音的全拼組合;
按照分詞結果,對拼音的全拼組合進行排列組合,得到n條全拼組合序列,n為大于等于1的自然數;
獲取所述目標中文信息在目標中文信息索引集中的偏移量;
將所述偏移量分別與n條全拼組合序列進行組合,得到n條全拼索引記錄;
將所述n條全拼索引記錄存入全拼組合序列中首個全拼組合對應的拼音在檢索索引集中對應的數據簇內;其中,n是大于等于1的自然數。
6.一種中文信息檢索引擎,其特征在于,所述引擎包括:
全拼組合接收單元,用于接收檢索關鍵字的全拼組合;
接收信息記錄單元,用于判斷所述全拼組合接收單元接收的全拼組合是否為第一個全拼組合,如果是,則觸發字母提取單元;
字母提取單元,用于從所述全拼組合中提取所述檢索關鍵字對應拼音的聲母的首字母及韻母;
一級索引偏移量檢索單元,用于在預置的二級檢索索引集中,檢索所述首字母對應的起始偏移量;
索引偏移量檢索單元,用于在一級檢索索引集中所述起始偏移量對應的位置開始,檢索所述首字母和韻母構成的拼音對應的起始偏移量和終止偏移量;
全拼索引記錄讀取單元,用于從預置的檢索索引集中,讀取所述起始偏移量到終止偏移量之間的全拼索引記錄,每條全拼索引記錄包括:目標中文信息全拼組合序列及目標中文信息偏移量;
全拼組合匹配單元,用于判斷所述檢索關鍵字的全拼組合與目標中文信息全拼組合序列中的第一個全拼組合是否相同,如果相同,則觸發目標信息第一檢索單元;
目標信息第一檢索單元,用于根據所述目標中文信息偏移量,從預置的目標中文信息索引集中,檢索目標中文信息。
7.如權利要求6所述的引擎,其特征在于,所述引擎進一步包括:
檢索結果保存單元,用于將檢索到的目標中文信息及目標中文信息全拼組合序列作為一條檢索結果,添加到第一檢索結果集中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高德軟件有限公司,未經高德軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910235592.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子文件顯示方法
- 下一篇:一種資本關聯關系的生成方法和設備
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





