[發明專利]新聞的重要程度獲取方法、裝置、終端設備及存儲介質在審
| 申請號: | 202011418091.2 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN112613296A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 趙洋;包榮鑫;王宇;龍大香 | 申請(專利權)人: | 深圳價值在線信息科技股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06K9/62;G06F16/35;G06F16/951 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 李建偉 |
| 地址: | 518000 廣東省深圳市福田區沙頭街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新聞 重要 程度 獲取 方法 裝置 終端設備 存儲 介質 | ||
1.一種新聞的重要程度獲取方法,其特征在于,所述重要程度獲取方法包括:
獲取針對同一事件的M篇新聞,M為大于1的整數;
獲取所述M篇新聞組成的N個新聞組各自對應的相似度,一個新聞組包括所述M篇新聞中的兩篇新聞,N是指從所述M篇新聞中抽取兩篇新聞的組合數,一個新聞組對應的相似度是指該新聞組所包含的兩篇新聞之間的相似度;
根據所述N個新聞組各自對應的相似度,獲取每篇新聞的初始重要程度;
獲取所述每篇新聞的信源權威性評分;
根據所述每篇新聞的初始重要程度和信源權威性評分,獲取所述每篇新聞的最終重要程度。
2.如權利要求1所述的重要程度獲取方法,其特征在于,所述獲取所述M篇新聞組成的N個新聞組各自對應的相似度包括:
對于所述N個新聞組中的第i個新聞組,所述第i個新聞組是所述N個新聞組中的任一新聞組,所述第i個新聞組包括第一新聞和第二新聞,獲取所述第一新聞的詞頻字典和所述第二新聞的詞頻字典,所述第一新聞的詞頻字典包括所述第一新聞中出現的關鍵詞和該關鍵詞在所述第一新聞中出現的次數,所述第二新聞的詞頻字典包括所述第二新聞中出現的關鍵詞和該關鍵詞在所述第二新聞中出現的次數;
根據所述第一新聞的詞頻字典和所述第二新聞的詞頻字典,檢測所述第一新聞和所述第二新聞中是否存在相同的關鍵詞;
若所述第一新聞和所述第二新聞中不存在相同的關鍵詞,則確定所述第i個新聞組的相似度為零;
若所述第一新聞和所述第二新聞中存在相同的關鍵詞,則根據該關鍵詞分別在所述第一新聞中出現的次數和在所述第二新聞中出現的次數,計算所述第i個新聞組的相似度。
3.如權利要求1所述的重要程度獲取方法,其特征在于,所述N個新聞組中的任一新聞組包括第一新聞和第二新聞,該新聞組對應的相似度包括所述第一新聞指向所述第二新聞的相似度,以及所述第二新聞指向所述第一新聞的相似度,所述根據所述N個新聞組各自對應的相似度,獲取每篇新聞的初始重要程度包括:
根據所述N個新聞組各自對應的相似度,構建第一有向圖模型,所述第一有向圖模型中節點為所述M篇新聞,所述第一有向圖模型中有向邊的起始節點指向終止節點的相似度大于預設相似度;
對于所述第一有向圖模型的任一節點j,根據所述第一有向圖模型,獲取所述節點j的入度節點和該入度節點的出度節點;
根據所述節點j的入度節點指向所述節點j的相似度、所述節點j的入度節點的權重,以及所述節點j的入度節點指向其出度節點的相似度,更新所述節點j的權重;
若檢測到所述節點j的權重的更新次數大于第一預設更新次數,或者所述節點j的權重收斂,則停止更新所述節點j的權重,并確定停止更新時所述節點j的權重為所述節點j對應的新聞的初始重要程度。
4.如權利要求1所述的重要程度獲取方法,其特征在于,所述獲取所述每篇新聞的信源權威性評分包括:
獲取所述M篇新聞的信源中的至少一個目標信源,以及每個目標信源鏈接的至少一個非目標信源;
根據所述M篇新聞的信源中的至少一個目標信源,以及每個目標信源鏈接的至少一個非目標信源,構建第二有向圖模型,所述第二有向圖模型中有向邊的起始節點與終止節點之間存在鏈接關系,所述第二有向圖模型中節點包括至少一個種子節點以及每個種子節點鏈接的至少一個非種子節點,所述種子節點是指所述目標信源,所述非種子節點是指所述非目標信源;
基于所述第二有向圖模型,從所述至少一個種子節點中的任一種子節點開始游走,在游走到任一節點g時,獲取所述節點g的入度節點,以及該入度節點的出度節點的數量;
檢測所述節點g是否屬于所述種子節點,得到檢測結果,所述檢測結果包括所述節點g屬于所述種子節點和所述節點g不屬于所述種子節點;
根據所述節點g的入度節點的權重、該入度節點的出度節點的數量,以及所述檢測結果,更新所述節點g的權重;
若檢測到所述節點g的權重的更新次數大于第二預設更新次數,或者所述節點g的權重收斂,則停止更新所述節點g的權重,并確定停止更新時所述節點g的權重為所述節點g對應的信源權威性評分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳價值在線信息科技股份有限公司,未經深圳價值在線信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011418091.2/1.html,轉載請聲明來源鉆瓜專利網。





