[發明專利]一種信息處理方法及裝置有效
| 申請號: | 201611258529.9 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106844540B | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 孫子荀 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/44 | 分類號: | G06F16/44 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 裝置 | ||
本發明實施例提供了一種信息處理方法及裝置,涉及信息處理領域,能夠在一定程度上提高入庫功能服務端口獲取信息的覆蓋范圍。本發明包括獲取用戶的輸入信息;從所述輸入信息中識別出鏈接地址信息,所述鏈接地址信息包括可獲取源信息的存儲位置信息;根據所述存儲位置信息獲取源信息,并將獲取到的所述源信息存儲至內容庫中。本發明實施例適用于信息采集的過程中。
【技術領域】
本發明涉及信息處理技術領域,尤其涉及一種信息處理方法及裝置。
【背景技術】
個性化閱讀產品越來越豐富,個性化閱讀類產品往往需要去收集大量的外網咨詢,建立自身的內容倉庫。比如國內的今日頭條和一點資訊都會去從互聯網爬取大量的新聞和視頻圖片等資源。
若依靠爬取收集模式進行內容倉庫的建立,會有大量的內容被爬取下來。而爬取下來的內容并不是直接可進行內容分發,還需要確定這些內容是否能第一時間覆蓋到全網的內容,而保證內容的時效性,則需要不斷投入的技術和大量機器資源監控來保障。普通的爬蟲很難做到大范圍很廣的覆蓋率,而且需要非常好的基礎建設以實現強大的內容處理能力,這樣才能實現從爬取的海量內容中選擇合適的內容進行曝光。
【發明內容】
有鑒于此,本發明實施例提供了一種信息處理方法及裝置,在一定程度上提高入庫功能服務端口獲取信息的覆蓋范圍。
第一方面,本發明實施例提供了一種信息處理方法,包括:
獲取用戶的輸入信息;
從所述輸入信息中識別出鏈接地址信息,所述鏈接地址信息包括可獲取源信息的存儲位置信息;
根據所述存儲位置信息獲取源信息,并將獲取到的所述源信息存儲至內容庫中。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,還包括:在所述獲取用戶的輸入信息之前,還包括:
獲取用戶的通知消息;
對所述通知消息進行識別,以確定所述通知消息是否包含指定關鍵詞;
若識別出所述通知消息包含指定關鍵詞,提示用戶錄入所述輸入信息。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,還包括:在根據所述存儲位置信息獲取源信息之前,還包括:
判斷所述存儲位置信息是否符合預設規則;
若所述存儲位置信息符合預設規則,提示用戶是否提交所述存儲位置信息;
響應于所述用戶的提交指令,執行步驟根據所述存儲位置信息獲取源信息。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,還包括:判斷所述存儲位置信息是否符合預設規則,包括:
判斷所述存儲位置信息是否為完整的統一資源定位符URL鏈接;
如果所述存儲位置信息是完整的URL鏈接,確定所述存儲位置信息符合預設規則;
如果所述存儲位置信息不是完整的URL鏈接,確定所述存儲位置信息不符合預設規則。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,還包括:在將獲取到的所述源信息存儲至內容庫中之后,還包括:
獲取與所述用戶具有關聯關系的其他用戶;
向所述其他用戶推送所述鏈接地址信息。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,還包括:在將獲取到的所述源信息存儲至內容庫中之后,還包括:
獲取與所述用戶具有關聯關系的其他用戶;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611258529.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種移動清灰的雙層布袋除塵裝置
- 下一篇:一種凹凸棒土殺菌除臭劑及制備方法





