[發明專利]一種基于互聯網的新聞信息檢索的控制方法及裝置在審
| 申請號: | 201711408540.3 | 申請日: | 2017-12-22 |
| 公開(公告)號: | CN108255963A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 李青龍;周世勇;彭璿韜;王雪峰 | 申請(專利權)人: | 北京智慧星光信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 劉昕;許志勇 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新聞信息 檢索 邏輯關系 搜索服務器 數據庫 寫入 關鍵字信息 去重操作 維度 信息交互平臺 輸入關鍵字 方式顯示 檢索信息 接口信息 清洗操作 區分顯示 文章信息 信息轉換 互聯網 可識別 轉換 高亮 文檔 語法 | ||
1.一種基于互聯網的新聞信息檢索的控制方法,其特征在于,包括:
輸入需要檢索的新聞信息的關鍵字信息和關鍵字之間的邏輯關系的信息,并將關鍵字之間的不同邏輯關系在服務端的可視化界面上通過不同顏色來區分顯示;
服務端將設置的關鍵字信息和關鍵字之間的邏輯關系的信息轉換成標準的邏輯關系表達式并存儲到服務端中;
服務端將轉換后的邏輯關系表達式、設定的多個維度檢索信息以及設置的需要檢索的新聞信息的關鍵字信息轉換為搜索服務器的數據庫可識別的語法接口信息后,進行新聞信息的檢索;
服務端對檢索到的新聞信息進行信息過濾的清洗操作,并將清洗操作后的新聞信息寫入搜索服務器的數據庫;
服務端通過哈希算法方式對寫入搜索服務器的數據庫的新聞信息進行內容去重操作,并寫入一面向文檔的數據庫后,將寫入一面向文檔的數據庫中進行內容去重操作后的新聞信息寫入搜索服務器的數據庫,并將檢索后的新聞信息通過高亮關鍵字的方式在服務端的可視化界面上進行顯示。
2.根據權利要求1所述的方法,其特征在于,
所述輸入需要檢索的新聞信息的關鍵字信息和關鍵字之間的邏輯關系的信息,并將關鍵字之間的不同邏輯關系在服務端的可視化界面上通過不同顏色來區分顯示的步驟,還包括:
在服務端的可視化界面上通過點擊操作完成切換關鍵字之間的邏輯關系。
3.根據權利要求1所述的方法,其特征在于,
所述服務端對檢索到的新聞信息進行信息過濾的清洗操作的步驟,包括:
服務端根據預設的網站和預設類型的新聞信息,對檢索到的新聞信息進行信息過濾的清洗操作;
服務端通過大數據處理引擎方式過濾檢索到的垃圾新聞信息;及
服務端對檢索到的新聞信息進行格式化操作,去掉無用的html信息。
4.根據權利要求3所述的方法,其特征在于,
所述服務端將清洗操作后的新聞信息寫入搜索服務器的數據庫的步驟,包括:
服務端將清洗操作后的新聞信息寫入ElasticSearch數據庫。
5.根據權利要求4所述的方法,其特征在于,
所述服務端通過哈希算法方式對寫入搜索服務器的數據庫的新聞信息進行內容去重操作,并寫入一面向文檔的數據庫后,將寫入一面向文檔的數據庫中進行內容去重操作后的新聞信息寫入搜索服務器的數據庫,并將檢索后的新聞信息通過高亮關鍵字的方式在服務端的可視化界面上進行顯示的步驟,包括:
服務端計算每條寫入搜索服務器的數據庫的新聞信息的simhash數值,根據得到的相同simhash數值的新聞條數來進行內容去重操作并寫入一面向文檔的數據庫后,將寫入一面向文檔的數據庫中進行內容去重操作后的新聞信息寫入ElasticSearch數據庫,并將檢索后的新聞信息通過高亮關鍵字的方式在服務端的可視化界面上進行顯示。
6.一種基于互聯網的新聞信息檢索的控制裝置,其特征在于,包括:
輸入單元,用于輸入需要檢索的新聞信息的關鍵字信息和關鍵字之間的邏輯關系的信息;
顯示單元,用于顯示輸入的信息和檢索后的新聞信息,其中,所述關鍵字之間的不同邏輯關系通過不同顏色來區分顯示,檢索后的新聞信息通過高亮關鍵字的方式在進行顯示;
轉換單元,用于將設置的關鍵字信息和關鍵字之間的邏輯關系的信息轉換成標準的邏輯關系表達式,并將轉換后的邏輯關系表達式、設定的多個維度檢索信息以及設置的需要檢索的新聞信息的關鍵字信息轉換為搜索服務器的數據庫可識別的語法接口信息;
檢索單元,用于檢索新聞信息,并對檢索到的新聞信息進行信息過濾的清洗操作,并將清洗操作后的新聞信息寫入搜索服務器的數據庫;通過哈希算法方式對寫入搜索服務器的數據庫的新聞信息進行內容去重操作,并寫入一面向文檔的數據庫后,將寫入一面向文檔的數據庫中進行內容去重操作后的新聞信息寫入搜索服務器的數據庫;及
數據庫存儲單元,用于存儲信息。
7.根據權利要求6所述的裝置,其特征在于,
所述輸入單元還用于,在顯示單元上通過點擊操作完成切換關鍵字之間的邏輯關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智慧星光信息技術有限公司,未經北京智慧星光信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711408540.3/1.html,轉載請聲明來源鉆瓜專利網。





