[發明專利]一種基于知識圖譜的搜索引擎可信搜索方法有效
| 申請號: | 202011263730.2 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112199514B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 丁春玲;曾國蓀;謝英杰 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/33;G06F16/953;G06N5/00 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 應小波 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 搜索引擎 可信 搜索 方法 | ||
1.一種基于知識圖譜的搜索引擎可信搜索方法,其特征在于,所述的可信搜索方法包括以下步驟:
步驟1:獲取用戶輸入的搜索關鍵詞,構建關鍵詞池;
步驟2:根據關鍵詞選擇策略SQ選擇n個關鍵詞,分別依次輸入m個搜索引擎進行搜索,獲得搜索引擎返回的結果;
步驟3:根據搜索結果選擇策略SR從搜索返回的Web網頁集合中選取k個返回結果;
步驟4:對步驟3選取的k個返回結果,依次構建Web網頁的知識圖譜;
步驟5:選擇具體的知識模式;
步驟6:將根據步驟4獲取的知識圖譜與既有語義可靠知識圖譜庫進行匹配,然后根據匹配結果計算各個Web網頁內容支持度;
步驟7:利用k個網頁的內容支持度期望對同一個關鍵詞下的m個搜索引擎進行排序,并綜合n個關鍵詞的網頁內容支持度情況,獲得最終的搜索引擎可信搜索排序結果;
步驟8:完成基于知識圖譜的搜索引擎可信搜索。
2.根據權利要求1所述的一種基于知識圖譜的搜索引擎可信搜索方法,其特征在于,所述的關鍵詞選擇策略SQ具體為:
對于用戶輸入的任意關鍵詞qi∈Q,分別統計其所屬于的領域dj∈D和類型ck∈C,得到所有關鍵詞的領域集合為D={d1,d2,...,d|D|},類型集合為C={c1,c2,...,c|C|},將所有關鍵詞按照領域和類型分為個塊,其中塊Qjk中有njk個關鍵詞,該關鍵詞的領域均為dj,類型均為ck,對于每一個塊Qjk,以概率從中隨機地選擇一個關鍵詞進行后續操作。
3.根據權利要求1所述的一種基于知識圖譜的搜索引擎可信搜索方法,其特征在于,所述的搜索結果選擇策略SR具體為:
將搜索返回的Web網頁集合R均分為m個塊,m<<|R|,R=R1∪R2∪...∪Rm,分別選擇塊Ri內TOP個Web網頁用于后續操作,其中i∈{1,2,...,m},
4.根據權利要求1所述的一種基于知識圖譜的搜索引擎可信搜索方法,其特征在于,所述的步驟4具體為:
每個搜索返回結果對應一個Web網頁,將Web網頁經過過濾和內容分析抽取后,將Web網頁轉換為一個唯一的知識圖WG=(Vw,Ew);遵循既有知識圖譜庫KG=(Vk,Ek)構建規則,將知識圖構建為一個有向圖,圖中節點類型ve、vc和vv分別表示Web網頁中存在的實體、類型和值;知識圖中的有向邊ep和er分別表示Web網頁中存在的屬性和關系;通過節點-有向邊-節點構成的三元組,即(v,e,v)表示Web網頁中蘊含的知識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011263730.2/1.html,轉載請聲明來源鉆瓜專利網。





