[發明專利]一種生成檢索詞條的方法及數據檢索方法和系統無效
| 申請號: | 200810066314.6 | 申請日: | 2008-03-19 |
| 公開(公告)號: | CN101251854A | 公開(公告)日: | 2008-08-27 |
| 發明(設計)人: | 畢亞雷;徐洪奎;杜如虛 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市君勝知識產權代理事務所 | 代理人: | 楊宏 |
| 地址: | 518067廣東省深圳市南山區蛇*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生成 檢索 詞條 方法 數據 系統 | ||
1.?一種生成檢索詞條的方法,其特征在于,所述方法包括以下步驟:
A、根據原始主題的詞條查詢相關詞匯,并建立相關詞匯推薦表;
B、利用相關詞匯推薦表查詢資料庫,檢索文獻摘要;
C、對檢索到的文獻摘要進行文本挖掘,獲得與主題詞內容相匹配的推薦詞條;
D、將推薦詞條插入到相關詞匯推薦表中,形成主題詞推薦表。
2.?根據權利要求1所述的方法,其特征在于,所述相關詞匯為:原始主題的同義詞、近義詞、相關詞中的一種或幾種的組合。
3.?根據權利要求1所述的方法,其特征在于,所述步驟D之后還包括以下步驟:
E、獲取用戶指令,并判斷用戶指令是否繼續檢索,若是,則執行步驟F;
F、對主題詞推薦表內的詞條進行篩選;
G、根據篩選后保留的詞條查詢相關詞匯,建立相關詞匯推薦表,并返回步驟B。
4.?根據權利要求1所述的方法,其特征在于,利用相關詞匯推薦表中的詞條構造正則表達查詢資料庫。
5.?根據權利要求1所述的方法,其特征在于,所述步驟C中,采用以下步驟進行文本挖掘:
C1、使用分詞技術提取文獻摘要的詞干;
C2、依據分詞結果,利用文獻特征提取方法獲得文獻摘要的文本特征矢量;
C3、建立類別模型,并對所獲得的文本特征矢量進行分類;
C4、查詢超過比例閾值門限的類別,并查找該類別模型的關鍵字,以該關鍵字作為所述推薦詞條。
6、?一種數據檢索方法,其特征在于,所述方法包括以下步驟:
A0、根據原始主題的詞條查詢相關詞匯,并建立相關詞匯推薦表;
B0、利用相關詞匯推薦表查詢資料庫,檢索文獻摘要;
C0、對檢索到的文獻摘要進行文本挖掘,獲得與主題詞內容相匹配的推薦詞條;
D0、將推薦詞條插入到相關詞匯推薦表中,形成主題詞推薦表;
E0、利用主題詞推薦表查詢資料庫,獲得文獻集。
7、?根據權利要求6所述的方法,其特征在于,所述步驟D0與步驟E0之間還包括以下步驟:
利用主題詞推薦表查詢與所述資料庫相對應的分類號資料庫,檢索文獻分類號,建立分類號推薦表;并且,
在步驟E0中,結合主題詞推薦表和分類號推薦表檢索資料庫,獲得文獻集。
8.?一種檢索詞條生成器,其特征在于,所述生成器包括:
相關詞條生成單元,用于根據原始主題的詞條查詢相關詞匯,并建立相關詞匯推薦表;
文獻摘要查詢單元,用于利用相關詞匯推薦表查詢資料庫,并檢索文獻摘要;
主題詞挖掘機,用于對檢索到的文獻摘要進行文本挖掘,獲得與主題詞內容相匹配的推薦詞條;及
插入單元,用于將推薦詞條插入到相關詞匯推薦表中,形成主題詞推薦表。
9.?根據權利要求8所述的生成器,其特征在于,所述生成器還包括:
人機交互模塊,用于將獲得的主題詞推薦表提供給用戶;
判斷單元,用于獲取用戶指令,并判斷用戶指令是否繼續檢索,若判斷用戶指令不繼續檢索,則控制所述插入單元輸出主題詞推薦表;
篩選單元,用于接收來自所述判斷單元的控制指令,并利用所述人機交互模塊篩選主題詞推薦表內的詞條,將篩選后保留的詞條送入到所述相關詞條生成單元中。
10.?根據權利要求8所述的生成器,其特征在于,所述生成器還包括:詞典庫,用于存儲相關詞匯,該詞典庫與所述相關詞條生成單元相連。
11.?根據權利要求8所述的生成器,其特征在于,所述生成器還包括:資料庫接口,該接口與所述文獻摘要查詢單元相連,用于進入資料庫。
12.?根據權利要求8所述的生成器,其特征在于,所述主題詞挖掘機包括:
分詞詞干提取單元,用于使用分詞技術提取所述文獻摘要的詞干;
文獻特征提取單元,用于接收分詞結果,并利用文獻特征提取方法獲得文獻摘要的文本特征矢量;
訓練模型單元,用于建立類別模型;
分類器,用于依據類別模型對所獲得的文本特征矢量進行分類;及
查找單元,用于根據分類結果查詢超過比例閾值門限的類別,并讀取該類別模型的關鍵字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810066314.6/1.html,轉載請聲明來源鉆瓜專利網。





