[發明專利]一種新型智能推薦資源的系統在審
| 申請號: | 201710398772.9 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107273450A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 肖雪松 | 申請(專利權)人: | 成都明途科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 新型 智能 推薦 資源 系統 | ||
技術領域
本發明涉及一種系統,具體涉及一種新型智能推薦資源的系統。
背景技術
借助于互聯網技術,大數據應用在各個方面持續深化,尤其是在人們的生活領域內,給人們的生活帶來了很多的便利。比如說推薦類的新聞客戶端,類似于今日頭條、網易新聞、鳳凰新聞等,有效地聚集了高質量的新聞,針對用戶的點擊、閱讀行為展開新聞推薦。新聞的內容涉及娛樂、體育、軍事、科技、財經等,由此可見,它們更加集中于人們的生活領域。
然而,面對著各種巨大工作壓力,在人們的工作領域,同樣,甚至更加需要這樣一種資訊推薦來不斷提升用戶的工作能力,開闊工作視野。目前,還沒有發現市場上有這樣一款集聚資源、面向工作的推薦應用。
當前,人們在工作過程中遇到問題,通常是有兩種方式解決:
1.搜索引擎的出現,類似百度,可以給人們的工作帶來很大的幫助,但是,同時需要人們從大量充斥著各種資源的互聯網中去尋找可能有用的信息。大量無效信息(廣告)以及重復信息的篩選,將消耗用戶大量時間和精力。
2.在移動互聯時代,人們的生活極度的碎片化,上班路上、休息間隙等等,手機都成了人們嚴重依賴的工具。如何能夠幫助人們利用這些碎片化時間提升自己的個人能力,有些應用(比如微信公眾號、專業網站的移動客戶端)其實在一定程度上做到了這一點,但是它的問題在于內容過于分散,資源不夠集中,同時也不能夠滿足針對用戶個人情況的個性化服務。
因此,如果能有一種應用,能夠匯聚集中互聯網上的各種優質資源,根據用戶的個人崗位和用戶使用行為,針對用戶自身需求進行個性化推薦服務,將極大地提升用戶的工作能力和個人素質。
發明內容
本發明所要解決的技術問題是現有的網絡資訊總量繁多且雜亂,在現在快節奏的生活中大量無效的信息及廣告極大地降低了人們的效率,不便于人們快速搜索,目的在于提供一種新型智能推薦資源的系統,解決現有的資訊不集中、內容分散,不能針對人們的個人情況快速篩選出優質有效的資源的問題。
本發明通過下述技術方案實現:
一種新型智能推薦資源的系統,包括網絡資源收集模塊,所述網絡資源收集模塊包括爬蟲分配裝置和爬蟲執行單元,所述網絡資源收集模塊連接有爬蟲依賴模塊和網頁分解模塊,網頁分解模塊連接有工作數據庫,工作收集庫連接有臨時增量數據庫,臨時增量數據庫連接有更新增量數據庫,更新增量數據庫連接有篩選模塊,篩選模塊連接有本地文件子系統和交互模塊,所述本地文件子系統與工作數據庫連接;
所述爬蟲依賴模塊用于配置網絡資源收集模塊與目標網絡資源之間的依賴關系;網絡資源收集模塊能夠通過爬蟲依賴模塊建立的依賴關系,通過爬蟲分配裝置配置相應爬蟲執行單元執行資源收集;
所述網頁分解模塊用于網頁的分解、去除廣告信息、去除噪聲;
所述工作數據庫用于和當前用戶興趣內容做相似度比較,根據相似度排序為用戶推送內容;
所述更新增量數據庫用于存儲一個時間周期內網站更新的內容;
所述臨時增量數據庫用于存儲接著上次爬取斷點爬取到的內容;
所述交互模塊用于分析用戶的興趣愛好,常輸入關鍵字;
所述篩選模塊用于篩選用戶在更新增量數據庫中交互模塊中得到關鍵字;
所述本地文件子系統用于存儲通過篩選模塊中的網頁數據。
所述的一種新型智能推薦資源的系統,本地文件子系統連接一個分布式文件子系統,所述分布式文件子系統,用于同步所述本地文件子系統中的網頁數據。
所述的一種新型智能推薦資源的系統,爬蟲分配裝置包括初始單元、網頁下載模塊、關閉單元,所述初始單元用于為網絡資源收集準備必要的存儲空間及系統開銷;所述網頁下載模塊用于根據目標網絡資源的數據類型選擇不同爬蟲程序收集目標網絡資源的數據;所述關閉單元用于在收集裝置收集到所需要的目標數據后釋放系統開銷以及在收集裝置出現異常時進行異常處理。
所述的一種新型智能推薦資源的系統,本地文件子系統包括URL過濾器,所述URL過濾器用于對收集的網頁數據進行重排。
所述的一種新型智能推薦資源的系統,URL過濾器為基于二進制數組bitSet的過濾器。
爬蟲系統主要完成網絡優質資源的獲取積累,并對爬下來的數據做處理和初步分析,其工作步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都明途科技有限公司,未經成都明途科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710398772.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于內存數據庫的斷點處理方法及系統
- 下一篇:余額數據更新方法和系統





