[發明專利]一種基于語義的信息關聯存儲和檢索的方法在審
| 申請號: | 201310089129.X | 申請日: | 2013-03-20 |
| 公開(公告)號: | CN103235780A | 公開(公告)日: | 2013-08-07 |
| 發明(設計)人: | 張經綸 | 申請(專利權)人: | 張經綸 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇銀創律師事務所 32242 | 代理人: | 何震花 |
| 地址: | 江蘇省南京市江寧區天*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 信息 關聯 存儲 檢索 方法 | ||
技術領域
本發明涉及數據檢索以及語義智能分析。
背景技術
當前信息領域已經進入大數據時代,如何能夠準確地檢索/搜索到所需要信息,是每一個用戶關心得問題。現有的搜索引擎如百度或Google中,我們輸入“元宵節”,我們得到的只有關于“元宵節”的信息,而不會得到關于“上元節”的信息。而其實“上元節”等同于“元宵節”,搜索“元宵節”就等同于搜索“上元節”。再比如在某一電子商務平臺中,用戶想要搜索“紅色襯衫”,那么“洋紅”、“粉紅”、“紫紅”、“橙紅”、“暗紅”、“桃紅”都可能是用戶想要的信息。對于各種不同的“紅色”,在中文系統中只需要檢索“紅”即可,但是在英文系統或者其他語言系統中,不同的“紅色”具有不同的詞語,比如“Red”、“Magenta”、“Pink”、“Purple”、“?Crimson”、“?Salmon”、“?Peachpuff”等。如果用戶需要與紅色類似的“Magenta”、“Pink”、“Purple”、“?Crimson”、“?Salmon”、“?Peachpuff”信息,則需要對需要對不同的詞進行語義解析后再進行檢索。
發明內容
本發明所要解決的問題是:在檢索系統中,提供一種語義智能分析系統,向用戶提供更多的檢索結果信息。
為解決上述問題,本發明采用的方案如下:
一種基于語義的信息關聯存儲和檢索的方法,包括語義信息數據庫和關鍵詞關聯數據庫。語義信息數據庫用于保存關鍵詞的內容信息。關鍵詞關聯數據庫用于保存關鍵詞關聯空間。該方法包括以下步驟:
S1,定義關鍵詞關聯空間;
S2,檢索關鍵詞的關聯關鍵詞;
S3,根據關鍵詞的關聯關鍵詞檢索語義信息數據庫檢索獲得相應的語義信息。
關鍵詞關聯空間包括關鍵詞關聯關系;關鍵詞關聯關系包括:主副關系、成員關系、類似關系、并列關系、對立關系和程度關系。各種不同的關鍵詞關聯關系之間構成關鍵詞關聯空間。為在這個關鍵詞關聯空間中檢索出關鍵詞的關聯關系,需要關鍵詞關聯關系運算檢索的步驟。所謂關鍵詞關聯關系運算檢索是根據關聯運算規則運算獲得某一關鍵詞的各種不同關聯關系的關鍵詞集合的檢索。關聯運算規則包括:傳遞規則,反推規則,演繹規則、加減規則等。關聯運算規則可以進一步作為關鍵詞關聯空間的一部分保存于關鍵詞關聯數據庫,即,關鍵詞關聯空間還可以包括關聯運算規則。關鍵詞關聯關系運算檢索的步驟根據不同的關鍵詞關聯關系的存儲方法,可以在步驟S1中實現,也可以在步驟S2中實現。即,步驟S1包括關鍵詞關聯關系運算檢索的步驟或步驟S2包括關鍵詞關聯關系運算檢索的步驟。
進一步,該方法還可以包括從用戶輸入信息中提取關鍵詞的步驟。
本發明的技術效果如下:
1、通過在檢索的時候之前加入關鍵詞語義分析擴大了檢索的范圍,提高檢索的準確性;
2、通過關鍵詞語義關系表達大大減少了信息內容的重復,特別是本發明定義了主副關系,只需要保存主詞的關鍵詞信息,從而減少了語義信息數據庫內容,減輕了語義信息數據庫的負擔;
3、本發明關鍵詞語義關系可隨時擴展;
4、本發明實現方法簡單,應用廣泛,可以應用于搜索引擎,也可以應用于特定領域的檢索服務,比如電子商務平臺、博客、論壇等其他領域。
附圖說明
無
具體實施方式
下面對本發明內容作進一步詳細說明。
1、語義信息數據庫
上述方法中的語義信息數據庫用于保存關鍵詞和關鍵詞相對應的數據信息,類似于一種詞典。語義信息數據庫中的信息內容是已經保存的。實際應用中,它未必是本發明涉及的系統的組成部分,也可能是通過網絡連接的外部數據庫,比如利用了Google搜索引擎獲得的數據內容。語義信息數據庫也可以是本發明涉及系統的組成部分。這種情況語義信息數據庫的內容需要自己定義,因而需要包括將關鍵詞的語義信息保存在語義信息數據庫中的步驟。語義信息數據庫中的“數據庫”只是一種表達,本領域技術人員理解,它也可以采用如Oricle、mySQL、DB2等關系數據庫,也可以采用如Versant、Db4o的面向對象數據庫,甚至還可以采用普通的文件方式。
2、關鍵詞關聯關系
在自然語言中,詞語之間的關系呈多樣化,比如同義詞關系,反義詞關系,對于形容詞或副詞還有其修飾對象的程度關系。本發明優先將自然語言中的詞語關系歸納成關鍵詞之間的六類:主副關系、成員關系、類似關系、對立關系、并列關系以及程度關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于張經綸,未經張經綸許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310089129.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種治療骨折的藥物
- 下一篇:聚丙烯腈纖維的制造方法及碳纖維的制造方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





