[發明專利]多維度高度可定制的新聞聚合方法在審
| 申請號: | 202010732996.0 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111881277A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張國衛;李學江;鄭有為 | 申請(專利權)人: | 新華智云科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/338;G06F16/34;G06F16/9535 |
| 代理公司: | 杭州裕陽聯合專利代理有限公司 33289 | 代理人: | 姚宇吉 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多維 高度 定制 新聞 聚合 方法 | ||
1.一種多維度高度可定制的新聞聚合方法,其特征在于,包含以下步驟:
獲取若干網絡媒體的新聞文獻;
對每一份所述新聞文獻進行預處理;
對每一份所述新聞文獻進行結構化處理以定義所述新聞文獻的多個檢索字段;
將結構化處理后的所述新聞文獻存入數據庫并構建索引;
接收用戶的配置信息,所述配置信息包含至少一個檢索字段限定;
根據用戶設定的所述配置信息從所述數據庫中檢索符合條件的所述新聞文獻;
將匹配到的所述新聞文獻發送至用戶。
2.根據權利要求1所述的多維度高度可定制的新聞聚合方法,其特征在于,
所述對每一份所述新聞文獻進行結構化處理以定義所述新聞文獻的多個檢索字段的具體方法為:
提取所述新聞文獻的文獻來源、關鍵詞和實體信息;
分析所述新聞文獻得到所述新聞文獻的情感指數和業務領域標簽;
將所述文獻來源、所述關鍵詞、所述實體信息、所述情感指數和所述業務領域標簽關聯至對應的所述新聞文獻將其作為所述新聞文獻的檢索字段。
3.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
當所述網絡媒體是社交媒體時,提取出的所述文獻來源還包含發布賬號;
用戶在配置文獻來源字段時,可以針對社交媒體設定若干具體的發布賬號。
4.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
所述關鍵詞包含標題關鍵詞和正文關鍵詞;
用戶在配置關鍵詞字段時可以分別設定標題關鍵詞字段和正文關鍵詞字段。
6.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
所述實體信息包含主要實體和次要實體;
用戶在配置實體信息字段時可以分別設定主要實體字段和次要實體字段。
7.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
經過分析得到的所述新聞文獻的情感指數包含:正面情感、中性情感和負面情感;
用戶在配置情感指數字段時可以從所述正面情感、所述中性情感和所述負面情感中選擇至少一種。
8.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
經過分析得到的所述新聞文獻的情感指數為大于等于負100且小于等于100之間的具體數值;
用戶在配置情感指數字段時可以設定一個或多個情感指數范圍。
9.根據權利要求2所述的多維度高度可定制的新聞聚合方法,其特征在于,
經過分析得到的所述業務領域標簽包含若干第一層級標簽,每個所述第一層級標簽還包含若干第二層級標簽;
用戶在配置業務領域標簽字段時可以分別設定第一層級標簽字段和對應的第二層級標簽字段。
10.根據權利要求1所述的多維度高度可定制的新聞聚合方法,其特征在于,
所述對每一份所述新聞文獻進行預處理的具體方法為:
對所述新聞文獻的正文進行提純;
對所述新聞文獻進行去重,保留最優的一份。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新華智云科技有限公司,未經新華智云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010732996.0/1.html,轉載請聲明來源鉆瓜專利網。





