[發明專利]用于擴展查詢式的方法和裝置有效
| 申請號: | 201710867794.5 | 申請日: | 2017-09-22 |
| 公開(公告)號: | CN107609152B | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 鐘輝強;尹存祥;沈劍平;徐國強 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/953;G06F16/9532;G06F16/955 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 擴展 查詢 方法 裝置 | ||
1.一種用于擴展查詢式的方法,其特征在于,所述方法包括:
基于已獲取的與目標查詢式關聯的圖片點擊日志計算目標查詢式的圖片點擊特征向量;
基于所述目標查詢式的圖片點擊特征向量,在預設的查詢式集合中查找所述目標查詢式的相似查詢式,得到所述目標查詢式的候選擴展查詢式集合;
將所述目標查詢式和所述候選擴展查詢式集合中的各候選擴展查詢式與知識圖譜中的實體詞和限定詞匹配,以提取出所述目標查詢式的實體詞和限定詞、以及各所述候選擴展查詢式的實體詞和限定詞;
結合所述知識圖譜對所述目標查詢式和各所述候選擴展查詢式的實體詞和限定詞進行擴展,其中,可以將所述目標查詢式的實體詞與擴展實體詞集合形成所述目標查詢式的實體詞集合,將所述目標查詢式的限定詞和擴展限定詞集合形成所述目標查詢式的限定詞集合;
根據所述候選擴展查詢式的實體詞和擴展實體詞與所述目標查詢式的實體詞集合中的實體詞的相似度,以及所述候選擴展查詢式的限定詞和擴展限定詞與所述目標查詢式的限定詞集合中的限定詞的相似度進行匹配,以從所述候選擴展查詢式集合中確定出所述目標查詢式的擴展查詢式。
2.根據權利要求1所述的方法,其特征在于,所述基于已獲取的與目標查詢式關聯的圖片點擊日志計算目標查詢式的圖片點擊特征向量,包括:
基于已獲取的與目標查詢式關聯的圖片點擊日志統計各預設時間窗口內與所述目標查詢式關聯的圖片的點擊數量;
對統計結果中小于預設點擊量閾值的點擊數量進行清洗,基于清洗后的各預設時間窗口內的與所述目標查詢式關聯的圖片的點擊數量構建所述圖片點擊特征向量。
3.根據權利要求1所述的方法,其特征在于,所述基于所述目標查詢式的圖片點擊特征向量,在預設的查詢式集合中查找所述目標查詢式的相似查詢式,得到所述目標查詢式的候選擴展查詢式集合,包括:
對所述預設的查詢式集合中的各個查詢式,統計與所述查詢式關聯的圖片的點擊數量,以構建所述預設的查詢式集合中各所述查詢式的圖片點擊特征向量;
計算所述預設的查詢式集合中的各查詢式的圖片點擊特征向量與所述目標查詢式的圖片點擊特征向量的相似度;
將與所述目標查詢式的圖片點擊特征向量的相似度大于預設相似度閾值的圖片點擊特征向量對應的查詢式作為候選擴展查詢式,形成候選擴展查詢式集合。
4.根據權利要求1所述的方法,其特征在于,所述將所述目標查詢式和所述候選擴展查詢式集合中的各候選擴展查詢式與知識圖譜中的實體詞和限定詞匹配,以提取出所述目標查詢式的實體詞和限定詞、以及各所述候選擴展查詢式的實體詞和限定詞,包括:
對所述目標查詢式和所述候選擴展查詢式集合中的各候選擴展查詢式進行切詞;
將切詞得到的詞語與所述知識圖譜中的實體詞進行匹配,得到所述目標查詢式的實體詞和各所述候選擴展查詢式的實體詞;
將切詞得到的詞語與所述知識圖譜中的實體詞的限定詞進行匹配,得到所述目標查詢式的限定詞和各所述候選擴展查詢式的限定詞。
5.根據權利要求1-4任一項所述的方法,其特征在于,所述結合所述知識圖譜對所述目標查詢式和各所述候選擴展查詢式的實體詞和限定詞進行擴展,包括:
基于所述知識圖譜中不同實體詞之間的知識結構關系,對所述目標查詢式和各所述候選擴展查詢式的實體詞進行擴展,得到所述目標查詢式和各所述候選擴展查詢式的擴展實體詞;
將所述目標查詢式和各所述候選擴展查詢式的限定詞與基于所述知識圖譜中的知識結構關系構建的關聯限定詞集合進行匹配,得到所述目標查詢式和各所述候選擴展查詢式的擴展限定詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710867794.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于Redis實現XBRL實例文檔緩存的方法
- 下一篇:一種圖書管理系統





