[發明專利]文本搜索意圖識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202210195245.9 | 申請日: | 2022-03-01 |
| 公開(公告)號: | CN114579703A | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 李全祚;趙濤;方德文;朱華煒;高亞迪;曲亮;朱安泰 | 申請(專利權)人: | 天九共享網絡科技集團有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08;G06F40/284 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 李建忠 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 搜索 意圖 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種文本搜索意圖識別方法,其特征在于,包括:
獲取目標用戶輸入的搜索文本,以及所述目標用戶的基本屬性信息和行為偏好數據;
根據所述搜索文本,生成文本向量化編碼特征;根據所述目標用戶的基本屬性信息和行為偏好數據,生成用戶向量化編碼特征;
將所述文本向量化編碼特征和所述用戶向量化編碼特征輸入到預先練好的意圖識別模型中,輸出所述搜索文本的意圖識別結果。
2.根據權利要求1所述的文本搜索意圖識別方法,其特征在于,所述根據所述搜索文本,生成文本向量化編碼特征包括:
對所述搜索文本進行分詞,得到包含一個或多個詞語的分詞列表;
根據分詞列表,獲取至少一個命名實體和至少一個內容標簽;
根據所述搜索文本以及所述搜索文本對應的詞語、命名實體和內容標簽,生成所述搜索文本對應的文本向量化編碼特征。
3.根據權利要求1所述的文本搜索意圖識別方法,其特征在于,所述根據所述目標用戶的基本屬性信息和行為偏好數據,生成用戶向量化編碼特征包括:
根據所述目標用戶的基本屬性信息,生成第一向量;
根據所述目標用戶的行為偏好數據,生成第二向量;
對第一向量和第二向量進行拼接;
將拼接結果輸入到預先訓練好的文本卷積神經網絡模型中,生成所述目標用戶的用戶向量化編碼特征。
4.根據權利要求1所述的文本搜索意圖識別方法,其特征在于,所述方法還包括:
根據所述目標用戶的基本屬性信息,生成所述目標用戶的dense特征。
5.根據權利要求4所述的文本搜索意圖識別方法,其特征在于,所述將所述文本向量化編碼特征和所述用戶向量化編碼特征輸入到預先練好的意圖識別模型中,輸出所述搜索文本的意圖識別結果包括:
根據所述文本向量化編碼特征和所述用戶向量化編碼特征,生成交叉向量編碼特征,其中,所述交叉向量編碼特征為文本向量化編碼特征和所述用戶向量化編碼特征的內積;
將所述文本向量化編碼特征、所述用戶向量化編碼特征、交叉向量編碼特征以及所述目標用戶的dense特征,輸入到預先練好的意圖識別模型中,輸出所述搜索文本的意圖識別結果。
6.根據權利要求1所述的文本搜索意圖識別方法,其特征在于,所述方法還包括:
獲取樣本數據,其中,所述樣本數據中包括多個用戶輸入搜索文本時獲取到的dense特征、文本向量化編碼特征、用戶向量化編碼特征、交叉向量編碼特征以及對應的意圖標簽;
根據所述樣本數據,對預先搭建的深度神經網絡分類模型進行訓練,得到所述意圖識別模型,其中,所述深度神經網絡分類模型包括:一個深度神經網絡和多個二分類神經網絡,其中,二分類神經網絡的數量等于意圖個數。
7.根據權利要求6所述的文本搜索意圖識別方法,其特征在于,所述意圖識別結果包括:一個或多個意圖分類,以及所述搜索文本屬于每個意圖分類的概率。
8.一種文本搜索意圖識別裝置,其特征在于,包括:
數據獲取模塊,用于獲取目標用戶輸入的搜索文本,以及所述目標用戶的基本屬性信息和行為偏好數據;
數據處理模塊,用于根據所述搜索文本,生成文本向量化編碼特征;根據所述目標用戶的基本屬性信息和行為偏好數據,生成用戶向量化編碼特征;
搜索意圖識別模塊,用于將所述文本向量化編碼特征和所述用戶向量化編碼特征輸入到預先練好的意圖識別模型中,輸出所述搜索文本的意圖識別結果。
9.一種電子設備,其特征在于,包括:
處理器;以及
存儲器,用于存儲所述處理器的可執行指令;
其中,所述處理器配置為經由執行所述可執行指令來執行權利要求1~7中任意一項所述文本搜索意圖識別方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1~7中任意一項所述的文本搜索意圖識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天九共享網絡科技集團有限公司,未經天九共享網絡科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210195245.9/1.html,轉載請聲明來源鉆瓜專利網。





