[發明專利]一種基于自然語言處理及圖像算法的文章自動生成系統和方法在審
| 申請號: | 202010176734.0 | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111428472A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 孟憲坤;邊樹森;劉志軍 | 申請(專利權)人: | 浙江華坤道威數據科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/258;G06F40/189;G06K9/00;G06F16/335;G06F16/58;G06N3/04;G06N3/08 |
| 代理公司: | 杭州信義達專利代理事務所(普通合伙) 33305 | 代理人: | 陳繼算 |
| 地址: | 310016 浙江省杭州市余杭區余杭街道*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 處理 圖像 算法 文章 自動 生成 系統 方法 | ||
本發明公開了一種基于自然語言處理及圖像算法的文章自動生成系統和方法,涉及人工智能領域,包括操作終端,輸入產品信息和用戶信息、輸出最終推文;基礎標簽提取系統,根據輸入的產品信息和用戶信息,利用BERT預訓練模型提取關鍵字,建立多個標簽;內容生成模塊,根據標簽信息生成相應的若干標題、若干文章內容和若干與文章內容相符的圖片;智能篩選模塊,包括文章篩選模塊和圖片篩選模塊,對于多個文章內容與相符圖片的組合,利用文章篩選模塊和圖片篩選模塊進行篩選,得到符合要求的一組文章內容與相符圖片;智能排版模塊,對最終選擇的文章及相符圖片進行排版,得到最終推文。
技術領域
本發明涉及人工智能領域,具體為一種基于自然語言處理及圖像算法的文章自動生成系統和方法。
背景技術
目前,企業向用戶推薦產品的方式越來越多,為了讓打出去的廣告能夠更吸引用戶的關注,最常見的方式就是各大平臺的文章推薦。傳統通常采用人工方式撰寫短文,有以下缺點:一、需要編寫的短文數量巨大,且編寫過程較為繁瑣,導致需要花費大量時間才能完成,使短文生成率低下;二、短文的撰寫往往基于企業角度,對用戶是吸引力小,導致推薦的短文適用性太差;三、為了吸引更多的關注,讓文章中包含貼合主旨的圖畫也是必不可少的,當前技術中缺乏對圖像生成的研究。
發明內容
本發明的目的在于提供一種基于自然語言處理及圖像算法的文章自動生成系統和方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種基于自然語言處理及圖像算法的文章自動生成系統,包括:
操作終端,輸入產品信息query和用戶信息、輸出最終推文;
基礎標簽提取系統,根據輸入的產品信息和用戶信息,利用BERT預訓練模型提取關鍵字,建立多個標簽;
內容生成模塊,包括標題生成模型、短文生成模型和圖像生成模型,根據標簽信息生成相應的若干標題、若干文章內容Ds和若干與文章內容相符的圖片;
智能篩選模塊,包括文章篩選模塊和圖片篩選模塊,對于多個文章內容與相符圖片的組合,利用文章篩選模塊和圖片篩選模塊進行篩選,得到符合要求的一組文章內容與相符圖片;
智能排版模塊,對最終選擇的文章及相符圖片進行排版,得到最終推文。
通過輸入簡單的產品信息,即可產生推文和相應的圖片,節約了大量的人力時間,提高了工作效率。
作為本發明的一種優選技術方案,所述智能排版模塊包括文本數據庫,通過深度學習BERT算法訓練出自動對文章與圖片進行排版的模型。
作為本發明的一種優選技術方案,所述內容生成模塊包括收集的標題數據庫、不同類型的短文數據庫;通過BERT預訓練模型訓練分別得到標題生成模型和短文生成模型;通過圖像生成模型-StackGAN算法繪制出與短文相符的圖片。
作為本發明的一種優選技術方案,所述圖片篩選模塊,根據圖像生成模型-StackGAN算法計算相符圖片與文章內容的契合度,設定閾值,選擇契合度最高的相符圖片。
作為本發明的一種優選技術方案,所述文章篩選模塊,所述文章篩選模塊,通過BERT預訓練模型計算產品信息query和每篇文檔d之間的相關性分數,query中包括詞q1,q2...qn,相關性分數的計算公式為:
其中R(qi,d)是查詢語句query中每個詞qi和文檔d的相關度值,Wi是詞qi的逆向文檔頻率IDF,其中,N為文檔總數,n(qi)為包含詞qi的文檔數;
其中,k1,k2,b為調節因子,qfi為詞qi在查詢語句query中的出現頻率,fi為qi在文檔d中的出現頻率,dl為文檔d的長度,avgdl為所有文檔的平均長度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江華坤道威數據科技有限公司,未經浙江華坤道威數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010176734.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





