[發明專利]句式推薦方法及裝置、電子設備、存儲介質有效
| 申請號: | 201811353225.X | 申請日: | 2018-11-14 |
| 公開(公告)號: | CN109542247B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 繆暢宇;牛力強 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F40/247;G06F40/211;G06F40/166 |
| 代理公司: | 深圳市聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句式 推薦 方法 裝置 電子設備 存儲 介質 | ||
1.一種句式推薦方法,其特征在于,包括:
從相似詞圖譜中查找對應于輸入詞匯的若干相似詞;
針對每一所述相似詞,將所述相似詞與所述輸入詞匯的歷史輸入文本進行拼接,得到對應于所述相似詞的候選句式;
將所述候選句式輸入語言模型,通過所述語言模型運算得到所述候選句式的合理度;
根據所述候選句式的合理度,篩選出合理句式進行推薦;
在將所述候選句式輸入語言模型,通過所述語言模型運算得到所述候選句式的合理度之前,還包括:
獲取多條原始查詢語句;
將所述原始查詢語句中的實體名詞替換為對應的類別名稱,得到目標語句;
將多條目標語句作為訓練集進行機器學習,獲得用于運算候選句式合理度的語言模型。
2.根據權利要求1所述的方法,其特征在于,在所述從相似詞圖譜中查找對應于輸入詞匯的若干相似詞之前,所述方法還包括:
獲取多條原始查詢語句;
將所述原始查詢語句中的實體名詞替換為對應的類別名稱,得到目標語句;
根據所有目標語句所含詞語之間的相似性關系,構建所述相似詞圖譜。
3.根據權利要求2所述的方法,其特征在于,所述將所述原始查詢語句中的實體名詞替換為對應的類別名詞,得到目標語句,包括:
根據所述實體名詞所在的實體詞典,獲得所述實體詞典對應的類別名稱;
將所述原始查詢語句中的實體名詞替換為獲得的所述類別名稱,得到所述目標語句。
4.根據權利要求2所述的方法,其特征在于,所述根據所有目標語句所含詞語之間的相似性關系,構建相似詞圖譜,包括:
對每條目標語句進行分詞操作,提取分詞操作后每個詞語對應的詞向量;
根據所述每個詞語對應的詞向量,計算不同詞語之間的相似度;
根據所述不同詞語之間的相似度,將一個詞語作為一個節點,選取與所述詞語最相似的若干詞語進行相似詞語之間的有向連接,形成所述相似詞圖譜。
5.根據權利要求1所述的方法,其特征在于,所述根據所述候選句式的合理度,篩選出合理句式進行推薦,包括:
根據每條候選句式的合理度,從所有候選句式中篩選出合理句式;
向前端推送所述合理句式中拼接的相似詞,觸發前端通過所述相似詞進行句式配置。
6.根據權利要求5所述的方法,其特征在于,在所述向前端推送所述合理句式中拼接的相似詞之后,所述方法還包括:
根據所述前端對所述相似詞進行的選擇,將選擇的目標相似詞與所述歷史輸入文本進行拼接,生成新的歷史輸入文本;
接收新的輸入詞匯,重復進行句式推薦的步驟。
7.一種句式推薦裝置,其特征在于,包括:
相似詞查找模塊,用于從相似詞圖譜中查找對應于輸入詞匯的若干相似詞;
句式拼接模塊,用于針對每一所述相似詞,將所述相似詞與所述輸入詞匯的歷史輸入文本進行拼接,得到對應于所述相似詞的候選句式;
合理度運算模塊,用于將所述候選句式輸入語言模型,通過所述語言模型運算得到所述候選句式的合理度;
句式推薦模塊,用于根據所述候選句式的合理度,篩選出合理句式進行推薦;
語句獲取模塊,用于獲取多條原始查詢語句;
類別替換模塊,用于將所述原始查詢語句中的實體名詞替換為對應的類別名稱,得到目標語句;
模型搭建模塊,用于將多條目標語句作為訓練集進行機器學習,獲得用于運算候選句式合理度的語言模型。
8.根據權利要求7所述的裝置,其特征在于,所述裝置還包括:
語句獲取模塊,用于獲取多條原始查詢語句;
類別替換模塊,用于將所述原始查詢語句中的實體名詞替換為對應的類別名稱,得到目標語句;
圖譜構建模塊,用于根據所有目標語句所含詞語之間的相似性關系,構建所述相似詞圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811353225.X/1.html,轉載請聲明來源鉆瓜專利網。





