[發明專利]一種文章的生成方法及裝置有效
| 申請號: | 201810331686.0 | 申請日: | 2018-04-13 |
| 公開(公告)號: | CN109190095B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 孫寶龍 | 申請(專利權)人: | 北京愛群游網絡信息技術有限公司 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F16/35;G06N3/08 |
| 代理公司: | 北京睿博行遠知識產權代理有限公司 11297 | 代理人: | 黃艷麗 |
| 地址: | 050000 河北省石家莊*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文章 生成 方法 裝置 | ||
1.一種文章的生成方法,其特征在于,包括:
獲取基礎語料集合,所述基礎語料集合為從基于目標產品的文本集合中獲取的基礎語料的集合,所述基礎語料用于生成文章;其中,所述獲取基礎語料集合包括通過神經網絡算法對所述文本集合進行分類,得到目標文本集合;利用關鍵詞提取TF-IDF技術對所述目標文本集合進行語料提取,得到所述基礎語料集合;所述通過神經網絡算法對所述文本集合進行分類,得到目標文本集合包括通過目標神經網絡語義分割模型對所述文本集合進行分類,得到所述目標文本集合;在所述通過目標神經網絡語義分割模型對所述文本集合進行分類,得到目標文本集合之前還包括獲取樣本文本,所述樣本文本包括至少一個標注的文本類別特征;利用所述包括至少一個標注的文本類別特征的樣本文本對預設的神經網絡語義分割模型進行訓練,得到所述目標神經網絡語義分割模型;
利用學習排序LTR算法對所述基礎語料集合中的基礎語料進行依次排序,得到待篩選基礎語料集合,所述待篩選基礎語料集合為在所述基礎語料集合中排序順序在預定范圍內的基礎語料的集合;其中,所述利用學習排序LTR算法對所述基礎語料集合進行依次排序包括根據預設特征以及LTR算法模型,對所述基礎語料集合進行依次排序,所述LTR算法模型為基于隨機森林算法生成的算法模型;
利用集合抽樣DPPS算法篩選所述待篩選基礎語料集合中的基礎語料,得到目標基礎語料集合;其中,所述利用集合抽樣DPPS算法篩選所述待篩選基礎語料集合中的基礎語料,得到目標基礎語料集合包括根據所述待篩選基礎語料集合中各待篩選基礎語料之間的權重比,得到第一待篩選基礎語料組;利用所述DPPS算法計算所述第一待篩選基礎語料組中基礎語料的第一平均權重值以及第一平均余弦相似度值;當所述第一平均權重值達到第一預設數值以及所述第一平均余弦相似度值達到第二預設數值時,將所述第一待篩選基礎語料組設置為所述目標基礎語料集合;
根據所述目標基礎語料集合生成文章。
2.如權利要求1所述的方法,其特征在于,在所述計算所述第一待篩選基礎語料組中基礎語料的平均權重值以及平均余弦值相似度之后,還包括:
當所述第一平均權重值未達到第一預設數值以及所述第一平均余弦相似度值未達到第二預設數值時,根據所述待篩選基礎語料集合中各待篩選基礎語料之間的權重比和余弦相似度,得到第二待篩選基礎語料組;
利用所述DPPS算法計算所述第二待篩選基礎語料組中基礎語料的第二平均權重值以及第二平均余弦相似度值;
當所述第二平均權重值達到第三預設數值以及所述第二平均余弦相似度值達到第四預設數值時,將所述第二待篩選基礎語料組設置為所述目標基礎語料集合。
3.如權利要求1-2中任一項所述的方法,其特征在于,所述根據所述目標基礎語料集合生成文章,包括:
根據所述目標基礎語料集合生成關于旅游景區的文章。
4.如權利要求3中所述的方法,其特征在于,在所述根據所述目標基礎語料集合生成關于旅游景區的文章之后,還包括:
通過智能推薦系統將所述關于旅游景區的文章發送給第一用戶組。
5.一種電子裝置,其特征在于,包括:
存儲器,用于存儲可執行指令;
以及處理器,用于與所述存儲器通信以執行所述可執行指令從而完成權利要求1-4任一所述文章的生成方法的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京愛群游網絡信息技術有限公司,未經北京愛群游網絡信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810331686.0/1.html,轉載請聲明來源鉆瓜專利網。





