[發明專利]一種用于確定用戶搜索意圖的方法及裝置有效
| 申請號: | 202010167600.2 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111680207B | 公開(公告)日: | 2023-08-04 |
| 發明(設計)人: | 莫益軍;姚盛楠;孫焱 | 申請(專利權)人: | 華中科技大學鄂州工業技術研究院;華中科技大學 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/332;G06F16/36;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 姚萱萱 |
| 地址: | 436044 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 確定 用戶 搜索 意圖 方法 裝置 | ||
1.一種用于確定用戶搜索意圖的方法,其特征在于,所述方法包括:
根據待搜目標集確定初始實體集,并根據所述初始實體集構建待搜目標知識圖譜及各實體的語義概念特征向量;
利用所述待搜目標集與所述初始實體集構建異構節點圖,并構建所述異構節點圖對應的第一鄰接矩陣;
接收至少一個用戶輸入的歷史搜索點擊事件,以所述歷史搜索點擊事件為弱監督目標,建立所述第一鄰接矩陣的監督模型,并對所述監督模型進行訓練;所述搜索點擊事件包括:歷史搜索關鍵詞及對應的歷史搜索結果;
接收當前用戶輸入的當前搜索關鍵詞,根據所述當前搜索關鍵詞及所述待搜目標知識圖譜生成候選搜索意圖擴展實體集;
利用訓練后的所述監督模型對所述候選搜索意圖擴展實體集進行意圖推理,獲得所述搜索意圖對應的待擴展搜索關鍵詞結果集;
根據所述待擴展搜索關鍵詞結果集與所述語義概念特征向量確定所述搜索意圖對應的目標搜索關鍵詞序列;其中,
所述接收至少一個用戶輸入的歷史搜索點擊事件,以所述歷史搜索點擊事件為弱監督目標,建立所述第一鄰接矩陣的監督模型,包括:
以所述歷史搜索點擊事件中的各歷史搜索關鍵詞作為各實體r,將對歷史搜索結果的點擊集合作為目標集合R,所述目標集合R中包括Q個搜索結果;
判斷所述目標集合中搜索結果u與所述搜索結果v是否在同一搜索關鍵詞對應的點擊集合中,若在,則將所述結果u與所述搜索結果v之間的第一搜索意圖關系的置位標識設置為第一標識;若不在,則將所述搜索結果u與所述搜索結果v之間的第一搜索意圖關系的置位標識設置為第二標識;所述搜索結果u與所述搜索結果v為所述目標集合中的任意兩個搜索結果;
將出現在所述目標集合中的各所述搜索結果與所述實體r之間的第二搜索意圖關系的置位標識設置為所述第一標識;
獲取所述目標集合中每個搜索結果對應的歷史搜索關鍵詞,基于所述每個搜索結果對應的歷史搜索關鍵詞確定實體集合Fq,將所述各實體r分別與所述實體集合Fq中所有實體之間的第三搜索意圖關系的置位標識設置為所述第一標識;
根據所述第一搜索意圖關系的置位標識、所述第二搜索意圖關系的置位標識及所述第三搜索意圖關系的置位標識建立所述第一鄰接矩陣的監督模型;其中,所述第一搜索意圖關系標記的置位標識、所述第二搜索意圖關系的置位標識標記及所述第三搜索意圖關系的置位標識為獨熱編碼one-hot向量。
2.如權利要求1所述的方法,其特征在于,根據待搜目標集確定初始實體集,并根據所述初始實體集構建待搜目標知識圖譜及各實體的語義概念特征向量,包括:
對所述待搜目標集中的當前待搜目標進行分詞處理,形成分詞集;
針對所述分詞集中的當前分詞,以所述當前分詞為核心基,利用漢語語言模型ngram及中文分詞模型BiLSTM-CRF對所述當前分詞進行實體修正,生成初始實體集;所述當前分詞為所述分詞集中的任一分詞;
根據所述當前待搜目標的屬性及所述初始實體集中的各分詞元素構建待搜目標知識圖譜;
基于所述待搜目標知識圖譜,構建所述初始實體集中的各實體的語義概念特征向量。
3.如權利要求2所述的方法,其特征在于,所述基于所述待搜目標知識圖譜,構建所述初始實體集中的各實體的語義概念特征向量,包括:
根據公式wi′=[word2vector(wi′),dr(wi′),r(wi′),n(wi′)]構建所述各實體的語義概念特征向量wi′;其中,所述i為所述初始實體集中的任一實體,所述word2vector(wi′)為詞向量函數;所述dr(wi′)為所述第i個實體在所述待搜目標知識圖譜上與鄰近實體的概率分布;所述r(wi′)為所述第i個實體在待搜目標集的所有知識圖譜中出現的概率;所述n(wi′)為所述第i個實體在待搜目標j的知識圖譜中的鄰居節點成對出現的次數與所述第i個實體在待搜目標j的知識圖譜中的鄰居節點的數量之間的比值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學鄂州工業技術研究院;華中科技大學,未經華中科技大學鄂州工業技術研究院;華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010167600.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:收集基于車輛的、與位置有關的數據組
- 下一篇:減振裝置





