[發明專利]定制潛在發生事件發生消息的實時搜索方法及系統在審
| 申請號: | 202010179054.4 | 申請日: | 2020-03-15 |
| 公開(公告)號: | CN111339426A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 文特;文愛博;其他發明人請求不公開姓名 | 申請(專利權)人: | 深圳創新黑科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518032 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 定制 潛在 發生 事件 消息 實時 搜索 方法 系統 | ||
本發明公開的定制潛在發生事件發生消息的實時搜索方法及系統,包括:會員模塊、設置模塊、爬蟲模塊、網頁處理模塊、網頁比較模塊、通知模塊、數據庫等,用戶設置好關鍵詞群、目標網站群、最早發生時間、抓取間隔時間等搜索條件,離開搜索頁面,爬蟲模塊按抓取間隔時間抓取目標網站群網頁,網頁處理模塊對網頁預處理,相關數據存儲進數據庫中,網頁比較模塊比較搜索條件,記載潛在發生事件發生的消息的網頁一旦生成,爬蟲模塊就會即時抓取到,通知模塊第一時間通過移動APP、手機短信、AI電話、郵件,以及微信、釘釘、QQ等社交工具等方式,將消息通知給用戶,保證人們在第一時間獲得所關心的潛在發生事件是否發生、何時發生等重要消息。
技術領域
本發明涉及網絡信息搜索技術領域,尤其涉及一種定制潛在發生事件發生消息的實時搜索方法及系統。
背景技術
當前,人們從互聯網上獲得信息的主要手段是通過搜索網頁瀏覽、APP、引擎搜索等方式。網頁瀏覽方式,人們在瀏覽器地址欄輸入地址,打開網站,瀏覽網頁或站內搜索,獲得信息。APP方式,人們打開APP,瀏覽網頁或站內搜索,獲得信息。搜索引擎方式,搜索引擎根據一定的策略、運用特定的計算機程序從互聯網上采集信息,在對信息進行組織和處理后,為用戶提供檢索服務,用戶在搜索框中輸入關鍵詞,返回搜索結果,翻頁、點擊搜索結果,獲得信息。
無論是哪一種方式獲取信息,都需要人們主動去查詢,才能獲得,而且查詢是當場反饋的,查詢結束,信息獲取就結束。查詢行為之后產生的信息,需要等下一次查詢行為發生,才能獲得。人們所關心的重要事件,是否發生、何時發生等消息,需要不停地查詢、搜索,才能獲得,既費時又費力,還不容易在第一時間獲得。
發明內容
人們所關心的重要事件發生后,為幫助人們第一時間獲得該消息,本發明提供了一種潛在發生事件發生消息的實時搜索方法及系統,包括:會員模塊、設置模塊、爬蟲模塊、網頁處理模塊、網頁比較模塊、通知模塊、數據庫等組成部分,這些模塊運行在服務器上,服務器通過網絡接入因特網,各模塊協同工作,用戶注冊并登陸會員模塊,設置模塊設置潛在發生事件的關鍵詞群、目標網站群、最早發生時間、抓取間隔時間等搜索條件,爬蟲模塊按抓取間隔時間不間斷地抓取目標網站群網頁,網頁處理模塊對網頁預處理,相關數據存儲進數據庫中,網頁比較模塊比較搜索條件,記載潛在發生事件發生的消息的網頁一旦生成,爬蟲模塊就會即時抓取到,網頁比較模塊比較搜索條件,比較成功,記載潛在發生事件發生的消息的網頁被找到,通知模塊將搜索結果、網頁摘要等潛在發生事件發生的消息第一時間通知給用戶,其執行流程如下:
S1:用戶打開會員模塊,注冊賬號,登陸實時搜索系統;
S2:打開設置模塊,設置潛在發生事件關鍵詞群、目標網站群、最早發生時間、爬取間隔時間等搜索條件,設定通知方式、結束條件;
S3:用戶點擊搜索按鈕,發送搜索指令,離開搜索頁面;
S4:實時搜索系統后臺執行搜索指令,訪問目標網站群;
S5:爬蟲模塊,按照爬取間隔時間不間斷地抓取網頁;
S6:網頁處理模塊,對網頁預處理,提取網頁類型、分析超鏈接、去除重復URL、去除重復網頁、網頁反垃圾、提取網頁生成時間、抽取文本、網頁摘要等,相關數據存入數據庫;
S7:網頁比較模塊,比較潛在發生事件的搜索條件,滿足搜索條件,找到記載潛在發生事件發生的網頁,觸發通知消息;
S8:通知模塊,第一時間按通知方式將潛在發生事件發生的消息通知給用戶;
S9:繼續搜索,轉到S4,結束搜索,轉到S10;
S10:用戶收到搜索結果通知,搜索結束。
所述的潛在發生事件發生消息的實時搜索系統,其特征在于,在WEB端、PC端或APP端為用戶提供實時搜索服務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳創新黑科技有限公司,未經深圳創新黑科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010179054.4/2.html,轉載請聲明來源鉆瓜專利網。





