[發明專利]一種基于智能機器人的新聞稿生成方法在審
| 申請號: | 201810251918.1 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108470064A | 公開(公告)日: | 2018-08-31 |
| 發明(設計)人: | 敖冰峰;楊宏帥 | 申請(專利權)人: | 黑龍江省經濟管理干部學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 孫莉莉 |
| 地址: | 150080 黑*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能機器人 實體機器人 數據抓取 條件檢索 新聞播報 新聞檢索 語音交互 語音識別 自動抽取 撰寫 整合 機器人 | ||
本發明提出了一種基于智能機器人的新聞稿生成方法,所述方法包括數據抓取,熱點人物、公司和事件的自動抽取、語音識別、新聞檢索和新聞稿自動撰寫。本發明將各種功能與實體機器人整合形成一個可以與用戶進行語音交互、條件檢索、自動新聞撰寫和新聞播報的家庭新聞機器人管家。
技術領域
本發明屬于無界傳媒智能新聞機器人技術領域,特別是涉及一種基于智能機器人的新聞稿生成方法。
背景技術
繼移動互聯網之后,人工智能浪潮已開始掀起,迅速進入機遇期。今年5、6月,國務院連續印發了《中國制造2025》和《關于積極推進互聯網+行動的指導意見》兩個國家戰略層面的文件,將我國智能產業推入快速發展的軌道。在“2015第五屆中國智能產業高峰論壇”上,多位院士、專家解讀了人工智能、互聯網和智能制造的趨勢和技術,人工智能技術將為基于互聯網和移動互聯網等領域的創新應用提供核心技術。
人工智能與媒體如何融合?互聯網上有海量的信息,如何從浩瀚的資訊中找出最可能受關注的數據?如何從數據中提取觀點?如何通過文字展示情感偏向?如何根據線索寫出新聞報道?利用大數據分析、深度學習讓機器自動撰寫新聞,已經成為目前亟待解決的技術問題。
發明內容
本發明為了解決現有的技術問題,提出了基于智能機器人的新聞稿生成方法。
本發明的目的通過以下技術方案實現:一種基于智能機器人的新聞稿生成方法,所述方法包括以下步驟:
步驟1、智能機器人對主流新聞網站的新聞板塊內容進行搜索與數據抓取;
步驟2、對抓取的數據進行挖掘,提取出人物、公司和事件;利用文本分析技術對所述人物、公司和事件進行分析,構建熱點識別模型,識別出熱點人物、公司和事件;
步驟3、對所述熱點人物、公司和事件進行分類和排名,評選出每周最熱的人物、公司和事件,推薦給智能機器人;
步驟4、被采訪用戶發出語音指令,智能機器人獲取語音識別出用戶關注的新聞命令,進行大數據分析檢索,檢索出符合特征新聞,根據評選出的每周最熱的人物、公司和事件進行特征匹配優先級判定,篩選出優先級最高的新聞,進行文字語音合成并采訪播報,從而形成采訪記錄語音;
步驟5、基于規則化大數據進行綜合處理與轉換,形成分類新聞原始數據集合,通過構建句子、段落和篇章級語料庫模板,建立具有綜合能力特征的新聞合成模板和語料合成模型;
步驟6、建立采訪記錄語音所合成的文字與新聞合成模板模糊匹配模型,采用多種數據合成、語料合成、數據替換、模糊比較與趨勢-歷史構建技術和規則化DOM文本生成技術,自動撰寫適合特定主題的新聞稿件。
進一步地,所述綜合能力特征包括充分融合規則數據分析、趨勢分析和歷史大比較分析。
進一步地,所述步驟4包含第一交流過程和第二交流過程,第一交流過程為被采訪用戶與智能機器人的自由交流過程,第二交流過程為智能機器人采訪交流過程。
進一步地,所述第一交流過程具體為:
步驟4.1、開始交流命令詞識別;
步驟4.2、被采訪用戶進行提問;
步驟4.3、智能機器人獲取提問語音,對語音進行識別,將識別后的文字進行存儲;
步驟4.4、對存儲的文字進行最長公共子序列算法匹配,找到對應的預置問題答案,所述問題答案為語音形式,對所述問題答案進行播放;
步驟4.5、智能機器人識別交流是否結束,如結束,則獲取結束交流命令字結束第一交流過程;如未結束則返回步驟4.2。
進一步地,所述第二交流過程具體為:
步驟4.6、開始,播放采訪許可詢問;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黑龍江省經濟管理干部學院,未經黑龍江省經濟管理干部學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810251918.1/2.html,轉載請聲明來源鉆瓜專利網。





