[發(fā)明專利]一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210424428.3 | 申請日: | 2022-04-21 |
| 公開(公告)號: | CN114817644A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計)人: | 周鳴樂;王然;李敏;李剛;韓德隆;劉一鳴;李旺 | 申請(專利權(quán))人: | 山東省計算中心(國家超級計算濟(jì)南中心);齊魯工業(yè)大學(xué) |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/903;G06F16/9032;G06F16/906;G06F16/951 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 elasticsearch 政府 信息資源 分類 智能化 搜索 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng),其特征在于,主要功能包括:實現(xiàn)政務(wù)信息資源按主題分類和智能化搜索,方法流程包括收集政府?dāng)?shù)據(jù),對政府信息資源按照政府信息內(nèi)在相關(guān)性和與公眾密切相關(guān)的主題進(jìn)行劃分,形成多級分類樹。搭建Elasticsearch集群,基于Elasticsearch對S1底層數(shù)據(jù)進(jìn)行優(yōu)化,通過RabbitMQ消息中間件異步接入政府信息資源數(shù)據(jù)。接受用戶查詢請求并對該請求進(jìn)行應(yīng)答。獲取用戶反饋存入評價列表,并根據(jù)評價列表更新多級分類樹。根據(jù)上述方法構(gòu)建系統(tǒng),系統(tǒng)分為數(shù)據(jù)收集清洗單元、存儲單元、服務(wù)單元、交互單元以及展示單元。
技術(shù)領(lǐng)域
本發(fā)明涉及政府?dāng)?shù)據(jù)采集分類以及查詢性能優(yōu)化領(lǐng)域,具體涉及一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng)。
背景技術(shù)
隨著電子政務(wù)的發(fā)展,政府提供的信息服務(wù)對公眾有著非凡的意義,個性化的、結(jié)構(gòu)化的信息服務(wù)模式要求電子政務(wù)能夠具備應(yīng)對動態(tài)信息需求的能力、解決電子政務(wù)信息發(fā)布零散的問題。另外政府信息資源的分類是開展信息交流和信息資源共享的重要前提。
在傳統(tǒng)的數(shù)據(jù)庫中,數(shù)據(jù)的組織形式是基于事務(wù)處理的,這很難考慮到在與信息服務(wù)需求密切相關(guān)的主題下組織信息,同時這些數(shù)據(jù)分散存儲在各個政府部門異構(gòu)的數(shù)據(jù)庫中,不能有效地集成數(shù)據(jù)。此外,大量的歷史數(shù)據(jù)離線存儲,難以在線查詢。最后現(xiàn)有的分類系統(tǒng)大多沒有統(tǒng)一的規(guī)范和全面的分類方案,而且分類方法簡單,不能滿足整體管理的需要。ElasticSearch是一個開源的分布式搜索引擎,它既能存儲和管理大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù),也能實現(xiàn)對其存儲數(shù)據(jù)的近實時全文檢索。在電子政務(wù)中引入Elasticsearch技術(shù),更合理地組織數(shù)據(jù)存儲結(jié)構(gòu)和數(shù)據(jù)資源挖掘,幫助電子政務(wù)提供越來越全方位、多功能的信息服務(wù),更好地滿足個性化信息服務(wù)的要求。對提高公眾滿意度和建立服務(wù)型政府具有積極意義。
發(fā)明內(nèi)容
本發(fā)明實例提供一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng),提高了政府信息資源的存儲效率和用戶在搜索和查詢政府?dāng)?shù)據(jù)時的效率。
為滿足上述需求,本專利提供了一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng),其特征在于,包括以下過程:
S1:收集政府?dāng)?shù)據(jù),對政府信息資源按照政府信息內(nèi)在相關(guān)性和與公眾密切相關(guān)的主題進(jìn)行劃分,形成多級分類樹。
S2:搭建Elasticsearch集群,基于Elasticsearch對S1底層數(shù)據(jù)進(jìn)行優(yōu)化,通過RabbitMQ消息中間件異步接入政府信息資源數(shù)據(jù)。
S3:接受用戶查詢請求并對該請求進(jìn)行應(yīng)答。
S4:獲取用戶反饋存入評價列表,并根據(jù)評價列表更新多級分類樹。
S5:根據(jù)上述方法構(gòu)建系統(tǒng),系統(tǒng)分為數(shù)據(jù)收集清洗單元、存儲單元、服務(wù)單元、交互單元以及展示單元。
1、據(jù)權(quán)力要求1所述的一種基于Elasticsearch的政府信息資源分類與智能化搜索方法和系統(tǒng),其特征在于,所述步驟S1包括:
S11:收集政府信息資源,所收集的數(shù)據(jù)包括內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)是政府組織內(nèi)部產(chǎn)生的當(dāng)前和歷史數(shù)據(jù);外部數(shù)據(jù)是通過網(wǎng)蟲爬網(wǎng)web所獲得的政府主題相關(guān)數(shù)據(jù),包括非官方政策解讀、商業(yè)報告、評估報告以及其他未經(jīng)收錄的其他信息。
S12:數(shù)據(jù)清洗,包括消除內(nèi)部和外部數(shù)據(jù)的各種語義沖突;分析內(nèi)部外部的統(tǒng)一數(shù)據(jù),包括同名文件、同名字段、同義詞、同主題詞;消除內(nèi)部外部數(shù)據(jù)冗余;統(tǒng)一所有數(shù)據(jù)的編碼規(guī)則。
S13:計算文檔之間的關(guān)聯(lián)度,按照政府?dāng)?shù)據(jù)的內(nèi)在聯(lián)系、文檔之間的關(guān)聯(lián)度以及主題進(jìn)行分類構(gòu)建多級分類樹。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東省計算中心(國家超級計算濟(jì)南中心);齊魯工業(yè)大學(xué),未經(jīng)山東省計算中心(國家超級計算濟(jì)南中心);齊魯工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210424428.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于Elasticsearch的DSL查詢方法
- 一種基于mongo數(shù)據(jù)庫的搜索系統(tǒng)
- 一種基于Presto和Elasticsearch的SQL查詢方法
- 一種基于Elasticsearch的數(shù)據(jù)處理方法及終端
- 一種Kafka與Elasticsearch數(shù)據(jù)庫數(shù)據(jù)的互相遷移方法
- 一種Elasticsearch數(shù)據(jù)查詢方法及系統(tǒng)
- 一種基于Elasticsearch的數(shù)據(jù)檢索方法、裝置、設(shè)備、介質(zhì)
- 基于條件下推elasticsearch的hive索引方法
- 一種Elasticsearch索引的加載方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- Elasticsearch搜索引擎的索引創(chuàng)建方法及裝置
- 一種基于政府業(yè)務(wù)數(shù)據(jù)梳理的方法
- 基于人才服務(wù)系統(tǒng)的信息處理系統(tǒng)及方法
- 智能政府
- 一種智能農(nóng)業(yè)系統(tǒng)
- 一種政務(wù)信息資源梳理及目錄管理系統(tǒng)和方法
- 地方政府債務(wù)風(fēng)險動態(tài)評估及預(yù)測方法
- 一種政府?dāng)?shù)據(jù)共享開放考核評估方法
- 一種智慧城市非政府平臺的監(jiān)管方法及系統(tǒng)
- 一種可視長期發(fā)展戰(zhàn)略大數(shù)據(jù)系統(tǒng)
- 一種行政區(qū)劃與政府機(jī)構(gòu)特色庫的構(gòu)建方法





