[發明專利]意圖確定模型的訓練方法和裝置有效
| 申請號: | 202110605114.9 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113343028B | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 張水發 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;G06V10/774;G06K9/62 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 楊凱程 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 確定 模型 訓練 方法 裝置 | ||
1.一種意圖確定模型的訓練方法,其特征在于,包括:
確定基于搜索詞進行搜索的搜索結果,以及基于所述搜索詞進行搜索的搜索次數;
確定在基于所述搜索詞進行的多次搜索中,用戶對搜索結果進行操作的總次數、用戶對所述搜索結果進行用戶意圖操作的第一次數以及用戶對所述搜索結果進行視頻意圖操作的第二次數,根據所述第一次數和所述總次數確定第一比例,根據所述第二次數和所述總次數確定第二比例;所述用戶意圖操作包括針對搜索結果的發布者的專有操作;所述視頻意圖操作包括針對搜索結果的專有操作;
根據所述搜索次數、所述第一比例以及所述第二比例,確定所述搜索詞對應的目標樣本標簽,所述目標樣本標簽包括用戶意圖標簽和/或視頻意圖標簽;所述用戶意圖標簽表征用戶對搜索結果的發布者感興趣;所述視頻意圖標簽表征用戶對搜索結果感興趣;
以所述搜索詞和所述目標樣本標簽作為樣本生成訓練樣本集;
將所述樣本的特征輸入意圖確定模型,得到所述樣本對應的目標樣本標簽的預測結果,根據所述意圖標簽預測結果和目標樣本標簽,確定損失數據,基于所述損失數據對意圖確定模型進行訓練,得到訓練后的意圖確定模型。
2.根據權利要求1所述的方法,其特征在于,基于所述損失數據對意圖確定模型進行訓練的收斂條件至少包括:
所述預測結果的準確率達到準確率閾值,其中,所述預測結果的準確率根據所述預測結果和所述樣本對應的目標樣本標簽確定。
3.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取至少一個專有名詞,確定所述專有名詞對應的目標樣本標簽包括視頻意圖標簽;
在所述專有名詞中確定被用作用戶名的用戶專有名詞,確定所述用戶專有名詞對應的目標樣本標簽還包括用戶意圖標簽;
其中,所述以所述搜索詞和所述目標樣本標簽作為樣本生成訓練樣本集包括:
以所述專有名詞和所述專有名詞對應的目標樣本標簽,以及所述搜索詞和所述搜索詞對應的目標樣本標簽作為樣本生成訓練樣本集。
4.根據權利要求1所述的方法,其特征在于,根據所述搜索次數、所述第一比例以及所述第二比例,確定所述搜索詞對應的目標樣本標簽包括:
確定所述搜索次數在多個數量區間中所屬的目標數量區間,以及所述目標數量區間對應的目標比例閾值;
在所述第一比例大于所述目標比例閾值時,確定所述搜索詞對應的目標樣本標簽包括用戶意圖標簽,和/或在所述第二比例大于所述目標比例閾值時,確定所述搜索詞對應的目標樣本標簽包括視頻意圖標簽;
其中,每個所述數量區間不重疊,所述數量區間的下限值,與所述數量區間對應的比例閾值反相關。
5.根據權利要求1所述的方法,其特征在于,所述用戶意圖操作包括以下至少之一:
點擊所述搜索結果的發布者、進入所述發布者的主頁、關注所述發布者。
6.根據權利要求1所述的方法,其特征在于,所述視頻意圖操作包括:
點擊所述搜索結果且未對所述搜索結果執行所述用戶意圖操作。
7.根據權利要求1至6中任一項所述的方法,其特征在于,在所述對意圖確定模型進行訓練之前,所述方法還包括:
根據所述樣本的屬性信息確定屬性特征;
確定所述樣本對應的搜索結果的操作特征;
將所述屬性特征和所述操作特征作為所述樣本的特征。
8.根據權利要求7所述的方法,其特征在于,所述意圖確定模型包括deepwide模型,所述屬性特征作為所述意圖確定模型deep側的輸入,所述操作特征作為所述意圖確定模型wide側的輸入。
9.根據權利要求7所述的方法,其特征在于,所述操作特征包括以下至少之一:
對所述搜索結果的發布者的點擊率、對所述發布者的關注率、對所述發布者主頁的平均消費時間、對所述搜索結果的點擊率、對所述搜索結果的點贊率、對所述搜索結果的關注率、對所述搜索結果的長播率、對所述搜索結果的零播率、對所述搜索結果的完播率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110605114.9/1.html,轉載請聲明來源鉆瓜專利網。





