[發明專利]基于人工智能的新聞速報生成方法及裝置有效
| 申請號: | 201710047783.2 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106776523B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 袁潔 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F16/34 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 新聞 生成 方法 裝置 | ||
1.一種基于人工智能的新聞速報生成方法,其特征在于,包括:
基于歷史新聞速報預先構建模板庫,所述模板庫中包括每個新聞類型用于生成新聞速報的基礎框架;
確定新聞事件隸屬的目標新聞類型;
根據所述目標新聞類型從所述模板庫中,獲取所述目標新聞類型的目標基礎框架;
從預設的數據庫中獲取所述新聞事件的結構化數據;
根據所述結構化數據向所述目標基礎框架中填充內容,得到所述新聞事件的新聞速報的正文;
根據所述正文生成所述新聞速報的標題,將所述標題與所述正文拼接形成所述新聞速報;
其中,所述基于歷史新聞速報,預先構建新聞速報的模板庫,所述模板庫中包括每個新聞類型用于生成新聞速報的基礎框架,包括:
針對同一新聞類型,對所有歷史新聞速報進行提取,得到所述歷史新聞速報中的結構化數據與新聞語料之間的對應關系;
利用所述歷史新聞速報中的結構化數據、新聞語料以及所述對應關系形成訓練集;
對所述訓練集進行文本訓練,挖掘各歷史新聞速報中可替換的結構化數據,形成所述基礎框架。
2.根據權利要求1所述的基于人工智能的新聞速報生成方法,其特征在于,所述形成所述基礎框架之后,還包括:
挖掘預設數量的所述歷史新聞速報中每兩個描述性短語的語義相似度;
根據所述語義相似度獲取表示同一語義的所有描述性短語;
利用表示同一語義的所有描述性短語生成該同一語義的潤色語句集。
3.根據權利要求2所述的基于人工智能的新聞速報生成方法,所述根據所述結構化數據向所述目標基礎框架中填充內容,得到所述新聞事件的新聞速報的正文之后,還包括:
利用所述潤色語句集中對所述正文中的同一語義的描述性短語進行隨機替換。
4.根據權利要求1所述的基于人工智能的新聞速報生成方法,其特征在于,所述形成所述基礎框架之后,還包括:
對預設數量的所述歷史新聞速報中的結構化數據進行挖掘,得到表示對象的結構化數據;其中,所述對象的結構化數據為名詞性的結構化數據;
識別用于表示同一對象的所有結構化數據;
利用同一對象的所有結構化數據生成該同一對象的同義詞表。
5.根據權利要求4所述的基于人工智能的新聞速報生成方法,所述根據所述結構化數據向所述目標基礎框架中填充內容,得到所述新聞事件的新聞速報的正文之后,還包括:
利用所述同義詞表中對所述正文中的同一對象的所述結構化數據進行隨機替換。
6.根據權利要求1-5任一項所述的基于人工智能的新聞速報生成方法,其特征在于,所述確定新聞事件隸屬的目標新聞類型,包括:
檢測是否有所述新聞事件發生;
當檢測到所述新聞事件后,確定所述新聞事件隸屬的所述目標新聞類型。
7.根據權利要求1-5任一項所述的基于人工智能的新聞速報生成方法,其特征在于,所述根據所述結構化數據向所述目標基礎框架中填充內容,得到所述新聞事件的新聞速報的正文,包括:
基于知識圖譜從所述數據庫中獲取與所述結構化數據相關的內容;
向所述目標基礎框架中填充所述結構化數據以及與所述結構化數據相關的內容,得到所述新聞速報的正文。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710047783.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種混合式的自定義手機端報表系統及方法
- 下一篇:一種多媒體批注方法和模塊





