[發明專利]一種基于互動百科知識的語義邏輯引導的搜索方法有效
| 申請號: | 201410086557.1 | 申請日: | 2014-03-11 |
| 公開(公告)號: | CN103870565B | 公開(公告)日: | 2017-04-05 |
| 發明(設計)人: | 何格;顧君忠;蘭小敏 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙)31215 | 代理人: | 徐筱梅,張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 互動 百科 知識 語義 邏輯 引導 搜索 方法 | ||
技術領域
本發明涉及信息抽取、查詢處理、信息檢索,具體地說是基于互動百科海量的三元關系組知識集,結合知識匹配算法來引導用戶的搜索。
背景技術
信息檢索技術包括搜索引擎是人們日常生活中尋找信息的常用工具,尤其是互聯網使用的普及化后,搜索引擎成為必不可少的網絡應用。
隨著互聯網信息的海量增長和人們對信息檢索的高準確性要求,單單依靠倒排索引和詞匹配技術的搜索引擎,在用戶輸入的查詢語句普遍比較短,不能詳細而準確描述查詢意圖的情況下,搜索效果不夠理想。尤其是詞語的多義問題讓搜索效果更加惡化。目前有很多研究從搜索引擎方面如語義消岐、查詢擴展、查詢日志分析、基于概念的搜索等以及從用戶使用角度的公式化查詢、用戶實時交互、查詢處理等在一定程度上提高了搜索引擎的搜索效果。而從用戶角度上如何讓用戶以更直接的更自然的語言輸入搜索引擎能有效處理的查詢語句的研究還需很大程度上的投入。
發明內容
本發明的目的是從用戶角度幫助用戶更準確的描述搜索意圖,尤其是幫助用戶將搜索引擎不能處理的帶有語義邏輯的查詢語句處理為依靠倒排和詞匹配的搜索引擎可以處理的一般邏輯而提供的一種基于互動百科知識的語義邏輯引導的搜索方法,該方法定義了四個語義邏輯符號,用戶可以使用這些符號來編輯查詢語句,編輯好的查詢語句在提交給搜索引擎之前,會先使用從互動百科中抽取的海量三元關系組結合詞語相似度的知識匹配和篩選來解析符號邏輯,生成搜索引擎能有效處理的只包含一般的與或非邏輯的查詢語句。同時可以返回推薦給用戶的其他查詢語句。
實現本發明目的的具體技術方案是:
一種基于互動百科知識的語義邏輯引導的搜索方法,其特征在于該方法包括以下具體步驟:
a)將互動百科在線描述的知識數據分為概念、關系和實體三類,根據三類知識之間的關系,形成三元關系組,以三元關系組的形式抽取并存儲互動百科的知識;
b)設定四個語義邏輯符號,用戶使用四個語義邏輯符號構建查詢語句,然后利用三元關系組的特點來處理該查詢語句,得到的新的查詢語句提交搜索引擎,并將處理得到的其他查詢語句推薦給用戶;其中,
所述概念具有唯一的語義,為互動百科的標題;關系是概念的屬性以及所有與概念有聯系的關系的描述;實體不具有唯一的語義,概念的某種關系下對應的是實體或是某個概念;
所述三類知識之間的關系是:概念、實體及兩者之間的關系和概念、概念及兩者之間的關系;概念、關系及實體形成三元關系組或者概念、概念及兩者之間形成三元關系組;
所述以三元關系組的形式抽取互動百科知識是:互動百科網頁標題定為該頁主概念,該互動百科網頁內的信息對-屬性、人物關系、從屬關系,有冒號兩邊、從標題及其下屬文本規律;信息對分別對應關系和實體或者關系和概念;
所述四個語義邏輯符號是:
“.”從屬、構成相關邏輯:根據概念和其相關的關系獲取對應的實體或概念集;
“:”相關、定義邏輯:根據概念描述或與概念相關的詞來明確該概念;
“^”相關邏輯:根據概念、關系及實體或概念之間的三元關系組的特點,由其中的兩元推出第三元;
“~”相似邏輯:使用相似邏輯來篩選數據;
所述使用四個語義邏輯符號構建查詢語句,利用三元關系組處理查詢語句是:用戶使用符號代替自然語言中的邏輯,然后利用三元關系組的特點來處理該邏輯。
本發明將百科知識分為三類數據,通過定義的四個語義邏輯符號,利用從互動百科海量的百科知識中抽取的三元關系組知識集,結合詞語相似度的知識匹配,來幫助用戶以更自然的語言邏輯構建查詢語句,尤其是使用在一般搜索引擎不能處理的相似、相關邏輯,并將此查詢語句處理為一般搜索引擎能有效處理的新的查詢語句,提高了搜索引擎的搜索精度。同時可以推薦給用戶更精確的查詢語句,甚至直接返回給用戶想要的知識。從而提高了搜索引擎的效率,提高用戶查詢滿意度。
附圖說明
圖1為本發明的流程圖;
圖2為本發明中互動百科知識抽取的詳細流程。
圖3-6為本發明在搜索中四個語義邏輯符號的處理流程圖;
圖7、圖8、圖9為實施本發明實施例圖。
具體實施方式
語義邏輯符號引導的搜索需要使用語義邏輯符號編輯查詢語句,同時需要互動百科里的三元關系組知識集。參閱圖1,其中互動百科知識的抽取和語義邏輯符號的定義和處理是重要部分,分別如下所述。
1.互動百科知識的抽取
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410086557.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于運行激光源的方法和設備
- 下一篇:網絡遠程監控系統





