[發明專利]頭版新聞預測分類方法有效
| 申請號: | 202010845229.0 | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN112100372B | 公開(公告)日: | 2022-08-30 |
| 發明(設計)人: | 曹開臣;戴禮燦;孫文;陳明仁;蔡世民 | 申請(專利權)人: | 西南電子技術研究所(中國電子科技集團公司第十研究所) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/215;G06F40/289;G06F40/284;G06F16/951;G06K9/62 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 劉世權 |
| 地址: | 610036 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 頭版 新聞 預測 分類 方法 | ||
本發明公開的一種頭版新聞預測分類方法,旨在一種能夠兼顧局部中心性和全局中心,并能表現出較好頭版新聞預測結果的新聞預測分類方法。本發明通過下述技術方案實現:首先通過用戶界面輸入要查詢的關鍵字,在互聯網上搜集網頁,將搜集到的網頁新聞文本信息保存到本地數據庫;文本表征模塊利用Doc2Vec表征算法進行向量表征,將每一篇新聞文本各自轉化為低維、高信息量的文本特征向量;相似性網絡構建模塊計算新聞間的相似度,根據計算所得的相似矩陣視為新聞相關網絡的鄰接矩陣,構建出新聞相似性網絡,遍歷完相似性網絡,是則根據支持H?指數貢獻矩陣迭代計算向量HR值,利用HR值對新聞進行權重排序,預測top?N條新聞作為頭版新聞。
技術領域
本發明涉及自然語言處理、人工智能預測分類領域,具體涉及一種報刊的頭版新聞智能預測方法。
技術背景
新聞媒介具有傳播信息、政治宣傳、普及教育、輿論監督、社會服務、文化娛樂等多方面功能。這些功能的發揮都要通過具體的新聞報道來實現,因此報道效果目標也相應呈多元化的形態。如通過報道宣傳某種政策、觀念或主張;通過批評報道揭露社會弊端,促進問題的解決;通過追蹤報道傳播最新信息、監視社會環境;通過活動策劃與新聞報道的結合,為社會公眾提供服務、娛樂,或進行道德教育、解決社會問題,或塑造報紙形象,擴大社會影響等。權威報刊的頭版新聞通常報道與國家政治、經濟政策相關的重要信息,代表國家政治、外交、經濟政策的發展方向,特別是其頭版新聞在不同時期對國家政治、經濟政策有著決定性的指導作用,被外界作為分析各國政治、經濟政策變化的渠道之一。因此,正確預測國家級報刊的頭版新聞對判斷國家政策變化具有重要意義。
信息技術的快速增長帶動了生活的網絡化,生活中存在各種各樣的網絡:在線社交網絡、科研網絡以及交通網絡等。社會網絡是人們通過各種關系建立起來的聯系,并通過成員之間的交互作用形成的一種網絡化結構。社會網絡分析法就是對于社會網絡的關系結構或者屬性進行分析,行動者可以是人、社區或者群體等,他們之間的關系能夠反映出一定的現象或者數據。其中諸多數據可以表示為二元圖G=(V,E),其中的V表示研究的成員集合,E是成員之間的關系的集合。社會網絡的一個突出的特點是存在少數的關鍵節點,這類節點對研究網絡的功能和保持網絡的穩定性具有重要的作用。例如網絡在遭受外界蓄意攻擊時,關鍵節點遭到攻擊就會導致整個的網絡癱瘓。網絡節點重要(中心)性排序是亟待解決的問題,這對處理信息流,預防傳染性的傳播以及網絡上的其他重要的行為具有非常重要的意義。
在自然界中存在的大量復雜系統都可以通過不同的復雜網絡加以描述。一個典型的復雜網絡是由許多節點與節點之間的連邊組成,其中節點用來代表真實系統中不同的個體,而連邊則用來表示個體間的關系。新聞媒體即為不同的新聞互相連接形成的新聞網絡。在復雜網絡領域的研究中,節點的核心地位確定是極其重要的。其應用包括識別社交網絡中最有影響力的人,互聯網或城市網絡中的關鍵基礎設施節點以及疾病的超級傳播者。中心性概念最早是在社交網絡分析中開發的,許多用于衡量中心性的術語都反映了它們的社會學淵源。中心性指數就是對節點核心地位的定量刻畫,借此反應該節點在網絡中的重要性。而“重要性”一詞有很多含義,導致對中心性的許多不同定義,目前主要有兩種不同的解釋。“重要性”可以被認為與網絡上的流或傳輸類型有關,這使得中心性可以根據在資源分配過程中對節點的依賴程度進行定義。“重要性”也可以被認為是節點對網絡凝聚力的貢獻情況,這使得中心性也可以通過衡量節點對網絡凝聚力貢獻的程度進行定義。通過研究網絡節點中心性的方式研究權威報刊頭版新聞的成因,可以從直觀的角度給出一個假設來解釋頭版新聞的成因,即“在新聞網絡中,新聞的中心性越大,其成為頭版新聞的可能性就高”。因此,利用預測新聞網絡節點中心性來實現頭版新聞的預測分類是具有較大研究價值的。
發明內容
本發明的任務是提供一種能夠兼顧局部中心性和全局中心,并能表現出較好頭版新聞預測結果的頭版新聞預測分類方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南電子技術研究所(中國電子科技集團公司第十研究所),未經西南電子技術研究所(中國電子科技集團公司第十研究所)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010845229.0/2.html,轉載請聲明來源鉆瓜專利網。





