[發明專利]新聞處理方法、裝置、存儲介質及計算機設備有效
| 申請號: | 201710791715.7 | 申請日: | 2017-09-05 |
| 公開(公告)號: | CN110020104B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 殷樂;花貴春;王丹丹;郎兵;趙林;胡博 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06F40/284;G06F18/2411;G06F18/241 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 趙福梅;張穎玲 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新聞 處理 方法 裝置 存儲 介質 計算機 設備 | ||
1.一種新聞處理方法,其特征在于,包括:
獲取待識別新聞的詞向量;
獲取事件的詞向量、以及所述事件的時間節點;
基于所述待識別新聞的詞向量與所述事件的詞向量的相似度,構建所述待識別新聞對應的第一特征,基于所述第一特征以及第一分類模型確定所述待識別新聞的關聯事件,以及,
基于第二特征以及第二分類模型,確定所述待識別新聞在所述關聯事件中所對應的時間節點,其中,所述第二特征是基于所述待識別新聞的時間與所述事件的時間節點的關系構建的,或者,
基于第三特征以及第三分類模型,確定所述待識別新聞在所述關聯事件中所對應的時間節點,其中,所述第三特征是基于所述待識別新聞的詞向量與所述事件的詞向量的相似度、以及所述待識別新聞的時間與所述事件的時間節點的關系構建的。
2.如權利要求1所述的新聞處理方法,其特征在于,所述獲取待識別新聞的詞向量,包括:
基于待識別新聞提取關鍵詞;
將所述提取的關鍵詞映射到詞向量空間,得到所述關鍵詞對應的詞向量。
3.如權利要求2所述的新聞處理方法,其特征在于,所述基于待識別新聞提取關鍵詞,包括:
從以下至少之一提取對應所述待識別新聞的關鍵詞:
所述待識別新聞;所述待識別新聞的特定關聯信息。
4.如權利要求1所述的新聞處理方法,其特征在于,所述獲取所述事件的時間節點,包括:
獲取所述事件的預先定義的時間節點;或
獲取所述事件的相關新聞并進行聚類處理,根據不同類別的相關新聞包含的時間信息確定所述事件的時間節點。
5.如權利要求1所述的新聞處理方法,其特征在于,所述基于所述第一特征以及第一分類模型確定所述待識別新聞的關聯事件,包括:
將所述第一特征作為樣本特征輸入第一分類模型,得到不同所述事件是所述待識別新聞的關聯事件的置信度;
確定置信度滿足條件的事件為所述待識別新聞的關聯事件。
6.如權利要求1所述的新聞處理方法,其特征在于,所述基于所述待識別新聞的詞向量與所述事件的詞向量的相似度,構建所述待識別新聞對應的第一特征,包括:
將以下的特征分量組合,得到所述待識別新聞對應的所述第一特征:
所述待識別新聞的詞向量與所述事件的詞向量的相似度;
所述待識別新聞的時間與所述事件的時間節點的關系。
7.如權利要求1所述的新聞處理方法,其特征在于,所述基于第二特征以及第二分類模型,確定所述待識別新聞在所述關聯事件中所對應的時間節點,包括:
基于所述待識別新聞的時間與所述事件的時間節點的關系,構建所述待識別新聞對應的第二特征;以及
輸出所述第二特征至第二分類模型,得到所述待識別新聞對應所述關聯事件不同時間節點的置信度;
確定置信度滿足條件的時間節點為所述待識別新聞所對應的時間節點。
8.如權利要求7所述的新聞處理方法,其特征在于,所述基于所述待識別新聞的時間與所述事件的時間節點的關系,構建所述待識別新聞對應的第二特征,包括:
將以下的特征分量組合,得到所述待識別新聞對應的所述第二特征:
所述待識別新聞的詞向量的均值;
所述待識別新聞的時間與所述關聯事件的不同時間節點的關系。
9.如權利要求1所述的新聞處理方法,其特征在于,所述基于第三特征以及第三分類模型,確定所述待識別新聞在所述關聯事件中所對應的時間節點,包括:
基于所述待識別新聞的詞向量與所述事件的詞向量的相似度、以及所述待識別新聞的時間與所述事件的時間節點的關系,構建所述待識別新聞對應的第三特征;
輸入所述第三特征至第三分類模型,得到所述待識別新聞的時間對應所述關聯事件的不同時間節點的置信度;
確定置信度滿足條件的時間節點為所述待識別新聞對應的時間節點,以及,將所述確定時間節點對應的事件為所述待識別新聞的關聯事件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710791715.7/1.html,轉載請聲明來源鉆瓜專利網。





