[發明專利]一種評論生成方法、裝置、設備及存儲介質有效
| 申請號: | 201910959216.3 | 申請日: | 2019-10-10 |
| 公開(公告)號: | CN110688832B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 趙鑫;李軍毅;付瑞吉;王士進;胡國平;秦兵;劉挺 | 申請(專利權)人: | 河北省訊飛人工智能研究院 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06N3/0442;G06N3/0455;G06Q30/0282 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 楊華 |
| 地址: | 065001 河北省廊坊市經濟技術*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 評論 生成 方法 裝置 設備 存儲 介質 | ||
1.一種評論生成方法,其特征在于,包括:
獲取目標對象的上下文信息,其中,所述上下文信息包括所述目標對象的標識、購買所述目標對象的用戶的標識,所述用戶對所述目標對象的評分;
通過所述評論生成模型和所述目標對象的上下文信息,預測能夠反映待生成的目標評論文本的整體內容走向的評論主題序列;
通過所述評論生成模型和所述評論主題序列,生成評論模板,其中,所述評論模板中包括表征粗粒度語義的詞,缺失表征細粒度語義的詞;
通過所述評論生成模型為所述評論模板補充所述表征細粒度語義的詞,獲得所述目標評論文本。
2.根據權利要求1所述的評論生成方法,其特征在于,所述通過所述評論生成模型和所述目標對象的上下文信息,預測能夠反映待生成的所述目標評論文本的整體內容走向的評論主題序列,包括:
通過所述評論生成模型的上下文編碼器,將所述目標對象的上下文信息編碼為上下文向量;
通過所述評論生成模型的主題解碼器和所述上下文向量,預測所述評論主題序列。
3.根據權利要求1所述的評論生成方法,其特征在于,所述通過所述評論生成模型和所述評論主題序列,生成評論模板,包括:
通過所述評論生成模型的模板解碼器,為所述評論主題序列中的每個主題預測一個評論模板,獲得所述評論主題序列中每個主題對應的評論模板。
4.根據權利要求1所述的評論生成方法,其特征在于,所述通過所述評論生成模型為所述評論模板補充所述表征細粒度語義的詞,獲得所述目標評論文本,包括:
通過所述評論生成模型的模板編碼器,對所述評論模板進行編碼,獲得所述評論模板的向量表示;
通過所述評論生成模型的評論解碼器和所述評論模板的向量表示,預測所述評論模板缺失的表征細粒度語義的詞,并將預測出的詞補充至所述評論模板中。
5.根據權利要求1所述的評論生成方法,其特征在于,預先建立所述評論生成模型的過程包括:
獲取訓練數據集,其中,所述訓練數據集中包括多條訓練數據,每條訓練數據包括一訓練上下文信息、該訓練上下文信息對應的真實評論文本、該訓練上下文信息對應的真實主題序列以及該訓練上下文信息對應的真實評論模板;
利用所述訓練數據集中的訓練數據訓練評論生成模型。
6.根據權利要求5所述的評論生成方法,其特征在于,所述評論生成模型包括上下文編碼器、主題解碼器、模板解碼器、模板編碼器和評論解碼器;
所述利用所述訓練數據集中的訓練數據訓練評論生成模型,包括:
利用訓練數據中的訓練上下文信息訓練所述上下文編碼器;
利用訓練數據中的訓練上下文信息和該訓練上下文信息對應的真實主題序列,訓練主題解碼器;
利用訓練數據中訓練上下文信息對應的真實主題序列和該訓練上下文信息對應的真實評論模板,訓練模板解碼器;
利用訓練數據中訓練上下文信息對應的真實評論模板和該訓練上下文信息對應的真實評論文本,訓練模板編碼器和評論解碼器。
7.根據權利要求6所述的評論生成方法,其特征在于,所述利用訓練數據中的訓練上下文信息和訓練上下文信息對應的真實主題序列,訓練所述主題解碼器,包括:
通過訓練得到的上下文編碼器,將訓練上下文信息編碼為上下文向量,得到該訓練上下文信息對應的上下文向量;
將該訓練上下文信息對應的上下文向量輸入主題解碼器,獲得主題解碼器預測的主題序列,作為該訓練上下文信息對應的預測主題序列;
根據該訓練上下文信息對應的預測主題序列、該訓練上下文信息對應的真實主題序列,以及預設的第一損失函數,更新主題解碼器的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河北省訊飛人工智能研究院,未經河北省訊飛人工智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910959216.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:短信文本模版的識別方法
- 下一篇:文本校正方法、裝置和設備





