[發明專利]信息推送的方法和裝置在審
| 申請號: | 202011275803.X | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112380331A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 劉丹;蔣思宏;邱立坤;鄒波 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/289;G06K9/62;G06N20/00;G06Q30/02 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 推送 方法 裝置 | ||
1.一種信息推送的方法,其中,包括:
響應于接收到文本輸入指令,獲取輸入的文本;
將所述文本輸入預先訓練的意圖識別模型,預測出所述文本的意圖標簽;
基于所述文本和所述文本的意圖標簽,從預先構建的語料庫中檢索出預設數量的候選語料,所述語料庫中預存有標記了意圖標簽的語料,所述候選語料的意圖標簽與所述文本的意圖標簽匹配,且所述候選語料的文本特征與所述文本的文本特征相似;
基于預設策略,對各所述候選語料排序,生成推薦語料列表;
推送所述推薦語料列表。
2.根據權利要求1所述的方法,其中,將所述文本輸入預先訓練的意圖識別模型,預測出所述文本的意圖標簽,包括:
對所述文本切詞,得到所述文本的詞集合;
確定所述詞集合中的每個詞與各意圖標簽之間的互信息,得到每個詞的互信息特征向量;
基于所述詞集合中的各個詞的互信息特征向量,生成所述文本的互信息特征矩陣;
將所述互信息特征矩陣,輸入預先訓練的意圖分類模型,估計出所述文本對應的各意圖標簽的置信度;
將置信度大于預設置信度閾值的意圖標簽,確定為所述文本的意圖標簽。
3.根據權利要求2所述的方法,其中,將所述文本輸入預先訓練的意圖識別模型,預測出所述文本的意圖標簽,還包括:
響應于所述文本所在的當前對話記錄中存在輸入時間早于該文本的其他對話文本,將所述對話記錄中輸入時間最接近所述文本的對話文本確定為第一對話文本,并確定出所述第一對話文本的意圖標簽與各所述意圖標簽之間的轉移概率;
基于所述轉移概率,生成所述文本的意圖標簽轉移特征向量;以及,
將所述互信息特征矩陣和所述意圖標簽轉移特征向量,輸入預先訓練的意圖分類模型,估計出所述文本對應的各意圖標簽的置信度。
4.根據權利要求3所述的方法,其中,所述意圖分類模型經由如下步驟訓練得到:
獲取樣本對話記錄,所述樣本對話記錄中包括按照輸入時間排序的多個樣本對話文本;
確定各所述樣本對話文本的意圖標簽;
從每個所述樣本對話文本的起始文字向后提取出預設長度的字符串,作為樣本文本;
基于所述樣本文本對應的樣本對話文本的意圖標簽,標記所述樣本文本;
對所述樣本文本進行切詞,并確定所述樣本文本的樣本互信息特征向量;
若所述樣本文本所在的樣本對話記錄中存在輸入時間早于該樣本文本的其他樣本對話文本,則確定出該樣本文本的樣本意圖標簽轉移特征向量;若所述樣本文本所在的樣本對話記錄中不存在輸入時間早于該樣本文本的其他樣本對話文本,則將該樣本文本的樣本意圖標簽轉移向量確定為零;
將所述樣本文本的樣本互信息特征向量和所述樣本意圖標簽轉移特征向量輸入預先構建的初始意圖分類模型,將所述樣本文本標記的意圖標簽作為期望輸出,訓練所述初始意圖分類模型,得到訓練后的意圖分類模型。
5.根據權利要求1至4之一所述的方法,其中,所述語料庫經由如下步驟構建:
從歷史日志中提取第一預設時間段內的歷史對話記錄,每個所述歷史對話記錄均包括多個歷史對話文本;
確定所述歷史對話文本的意圖標簽;
從所述歷史對話文本中提取出該歷史對話文本的特征信息,所述特征信息包括所述文本特征信息、輸入時間信息和頻次信息,所述頻次信息包括所述歷史對話文本在第二預設時間段內被推送的次數和/或所述歷史對話文本被選中的次數;
將所述歷史對話文本確定為語料,并基于所述歷史對話文本、所述歷史對話文本的特征信息和所述歷史對話文本的意圖標簽,生成元數據;
將所述元數據存入數據庫,得到所述語料庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011275803.X/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





