[發明專利]一種信息生成的方法、裝置和存儲介質在審
| 申請號: | 202011272860.2 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112348273A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 李浩然 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q30/06;G06K9/62 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 吳點;鄭紅娟 |
| 地址: | 100083 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息 生成 方法 裝置 存儲 介質 | ||
本申請公開了一種信息生成的方法、裝置和存儲介質,具體為首先獲取物品描述文本樣本和摘要信息樣本,并通輸入預先訓練的創意度預測模型,生成摘要信息樣本的創意度分數,基于摘要信息樣本和對應的創意度分數,訓練得到物品摘要信息生成模型,并在訓練時基于摘要信息樣本對應的創意度分數中包含的創意度權重,計算物品摘要信息生成模型中的第一損失函數,優化物品摘要信息生成模型,獲取待處理物品描述文本并輸入物品摘要信息生成模型,生成與待處理物品描述文本對應的摘要信息。本申請實施例通過利用物品描述文本樣本的創意度分數對訓練樣本進行加權,創意度分數越高的創意度權重越高,以使待訓練的物品摘要信息生成模型輸出創意度較高的摘要信息。
技術領域
本申請涉及計算機技術領域,尤其涉及一種信息生成的方法、裝置和存儲介質。
背景技術
商品摘要作為可以簡潔明確的突出商品性質和價值的內容,已被大規模的使用在電子商務領域。一般使用自然語言生成技術根據商品的詳細文本介紹,自動生成商品摘,但生成的商品摘要不會對商品賣點進行限制,僅為通用文本,使得生成的商品摘要過于平淡,缺乏亮點,精確度不高。
發明內容
本申請實施例提供了一種信息生成的方法,克服了商品摘要生成時精確度不足的問題。
該方法包括:
獲取物品描述文本樣本和摘要信息樣本;
將所述物品描述文本樣本和所述摘要信息樣本輸入預先訓練的創意度預測模型,生成所述摘要信息樣本的創意度分數;
基于所述摘要信息樣本和對應的所述創意度分數,訓練得到物品摘要信息生成模型,并在訓練時基于所述摘要信息樣本對應的所述創意度分數中包含的創意度權重,計算所述物品摘要信息生成模型中的第一損失函數,并基于所述第一損失函數優化所述物品摘要信息生成模型;
獲取待處理物品描述文本,并將所述待處理物品描述文本輸入所述物品摘要信息生成模型,生成與所述待處理物品描述文本對應的摘要信息。
可選地,計算所述摘要信息樣本中包含的至少一個樣本詞的創意度概率,所述創意度概率用于表示所述樣本詞或所述摘要信息樣本所具備創意度的概率;
計算所述物品描述文本樣本組成的訓練集中包含的每個所述樣本詞的逆文本頻率指數,以及,計算每個所述樣本詞的所述逆文本頻率指數的均值,并將每個所述樣本詞的所述逆文本頻率指數與均值的比值作為所述樣本詞的通用度分數,所述通用度分數用于表示所述樣本詞或所述摘要信息樣本作為所述摘要信息樣本的使用頻率;
將所述摘要信息樣本包含的每個所述樣本詞的所述創意度概率的均值作為所述摘要信息樣本的所述創意度概率,以及,將所述摘要信息樣本包含的每個所述樣本詞的所述通用度分數的均值作為所述摘要信息樣本的所述通用度分數,并基于預設權重系數為所述創意度概率和所述通用度分數分配對應的創意度權重并求和,以生成所述摘要信息樣本的所述創意度分數。
可選地,將所述摘要信息樣本輸入所述創意度預測模型中的創意度概率分類器,生成所述摘要信息樣本中包含的至少一個所述樣本詞的創意度概率,其中,所述創意度概率分類器的訓練過程為:
當所述樣本詞包含創意詞信息時,通過待訓練的所述創意度概率分類器生成所述樣本詞的預測創意度概率,通過所述預測創意度概率和預先確定的所述樣本詞的實際創意度概率計算交叉熵,確定所述預測創意度概率分類器的第二損失函數,進行迭代訓練,確定所述預測創意度概率分類器。
可選地,基于所述摘要信息樣本包含的至少一個樣本詞,生成所述樣本詞作為所述摘要信息樣本的概率;
根據所述樣本詞可作為所述摘要信息樣本的概率和所述樣本詞的所述創意度概率生成的損失函數,以及所述第二損失函數,生成所述待訓練的物品摘要信息生成模型的所述第一損失函數,并基于所述第一損失函數對所述待訓練的物品摘要信息生成模型進行訓練,確定所述物品摘要信息生成模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011272860.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種PE防滲透膜生產工藝
- 下一篇:一種海底用的線纜對接的初步處理裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





