[發(fā)明專利]一種基于Elasticsearch的數(shù)據(jù)加密檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310055324.4 | 申請(qǐng)日: | 2023-01-17 |
| 公開(kāi)(公告)號(hào): | CN116010987A | 公開(kāi)(公告)日: | 2023-04-25 |
| 發(fā)明(設(shè)計(jì))人: | 王靖午 | 申請(qǐng)(專利權(quán))人: | 方盈金泰科技(北京)有限公司 |
| 主分類號(hào): | G06F21/60 | 分類號(hào): | G06F21/60;G06F40/289 |
| 代理公司: | 北京研展知識(shí)產(chǎn)權(quán)代理有限公司 16009 | 代理人: | 許亞芬 |
| 地址: | 102300 北京市門頭溝區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 elasticsearch 數(shù)據(jù) 加密 檢索 方法 | ||
一種基于Elasticsearch的數(shù)據(jù)加密檢索方法包括:在TokenFilter中應(yīng)用加密算法得到加密TokenFilter,對(duì)Token進(jìn)行加密;所述TokenFilter為過(guò)濾器,所述Token為詞項(xiàng),所述詞項(xiàng)為語(yǔ)句分詞后的分詞結(jié)果;將加密TokenFilter嵌入到IK分詞器中得到加密IK分詞器,所述IK分詞器為Elasticsearch內(nèi)置的分詞插件;將加密IK分詞器打包生成新的插件安裝到Elasticsearch中,重啟Elasticsearch,將文檔寫入Elasticsearch時(shí),管理員指定所述加密IK分詞器完成文檔內(nèi)部詞項(xiàng)加密;數(shù)據(jù)訪問(wèn)請(qǐng)求者將查詢語(yǔ)句輸入進(jìn)加密IK分詞器得到加密查詢?cè)~項(xiàng),數(shù)據(jù)訪問(wèn)請(qǐng)求者將所述加密查詢?cè)~項(xiàng)輸入至安裝了加密IK分詞器的Elasticsearch中,得到查詢結(jié)果。本發(fā)明通過(guò)實(shí)現(xiàn)加密TokenFilter的方法得到加密IK分詞器,從而給出了一種Elasticsearch索引加密方法,以此達(dá)到數(shù)據(jù)安全保護(hù)的目的,降低數(shù)據(jù)泄漏的風(fēng)險(xiǎn)。
技術(shù)領(lǐng)域:
本發(fā)明涉及信息安全技術(shù)領(lǐng)域,具體涉及一種基于Elasticsearch的數(shù)據(jù)加密檢索方法。
背景技術(shù):
Elasticsearch是一個(gè)開(kāi)源分布式搜索引擎,其數(shù)據(jù)模型以倒排索引為核心。在使用上Elasticsearch有數(shù)據(jù)寫入和數(shù)據(jù)查詢兩大步驟,文檔寫入Elasticsearch要經(jīng)過(guò)文本預(yù)處理、文本分詞、倒排索引構(gòu)建等關(guān)鍵步驟,文本預(yù)處理是對(duì)原始文檔進(jìn)行字符轉(zhuǎn)換、HTML標(biāo)簽剝離等操作。分詞是指將連續(xù)的字序列按照按照一定的方法切分成以詞為單位的序列。詞是表達(dá)語(yǔ)義的最小單位,文本分詞可以幫助搜索引擎識(shí)別語(yǔ)句的含義,從而提升搜索結(jié)果的匹配效果。檢索時(shí),查詢語(yǔ)句會(huì)經(jīng)分詞器分詞,通過(guò)分詞結(jié)果到倒排索引中去匹配相關(guān)文檔。IK分詞器是一個(gè)開(kāi)源的中文分詞器,該分詞器以插件的形式存在,是最為常用的中文分詞插件,在Elasticsearch生態(tài)圈中有著廣泛的使用。
開(kāi)源版本的Elasticsearch不具備任何數(shù)據(jù)保護(hù)功能,在數(shù)據(jù)安全方面存在如下缺點(diǎn):(1)缺少訪問(wèn)控制策略。Elasticsearch有著開(kāi)箱即用的特點(diǎn),無(wú)需任何身份驗(yàn)證即可公開(kāi)訪問(wèn),默認(rèn)不設(shè)置訪問(wèn)控制,如果服務(wù)器防火墻對(duì)于端口開(kāi)放策略過(guò)于激進(jìn),Elasticsearch集群端口部署后即可公網(wǎng)訪問(wèn),IP和端口一旦泄漏就會(huì)給攻擊者留下數(shù)據(jù)泄漏的隱患。(2)缺少數(shù)據(jù)安全管控。Elasticsearch設(shè)計(jì)之初就是為了讓用戶快速檢索到信息,并沒(méi)有數(shù)據(jù)保護(hù)的需求,即原始數(shù)據(jù)不做脫敏、加密等安全手段的處理,未經(jīng)授權(quán)的用戶非法獲取后可能會(huì)引起嚴(yán)重后果。
發(fā)明內(nèi)容:
針對(duì)上述問(wèn)題,本發(fā)明提供了一種基于Elasticsearch的數(shù)據(jù)加密檢索方法,對(duì)Elasticsearch內(nèi)置的IK分詞器進(jìn)行改造,通過(guò)實(shí)現(xiàn)加密TokenFilter的方法對(duì)文本的分詞結(jié)果加密,避免因缺少訪問(wèn)控制而產(chǎn)生的Elasticsearch數(shù)據(jù)泄露。
一種基于Elasticsearch的數(shù)據(jù)加密檢索方法,所述方法包括:
步驟1:文檔加密寫入Elasticsearch,所述Elasticsearch為一種搜索引擎;
步驟2:執(zhí)行數(shù)據(jù)加密檢索:數(shù)據(jù)訪問(wèn)請(qǐng)求者將查詢語(yǔ)句輸入進(jìn)加密IK分詞器得到加密查詢?cè)~項(xiàng),數(shù)據(jù)訪問(wèn)請(qǐng)求者將所述加密查詢?cè)~項(xiàng)輸入至安裝了加密IK分詞器的Elasticsearch中,得到查詢結(jié)果;
其中,所述文檔加密寫入Elasticsearch的方法包括以下步驟:
步驟1:在TokenFilter中應(yīng)用加密算法得到加密TokenFilter,對(duì)Token進(jìn)行加密;所述TokenFilter為過(guò)濾器,所述Token為詞項(xiàng),所述詞項(xiàng)為語(yǔ)句分詞后的分詞結(jié)果;以百度搜索引擎為例,一般情況下數(shù)據(jù)訪問(wèn)請(qǐng)求者在輸入框里面輸入的是一句查詢語(yǔ)句,比如“今天天氣怎么樣”,搜索引擎會(huì)對(duì)這個(gè)字符串先分詞,分為“今天”、“天氣”、“怎么樣”,分詞后的結(jié)果就是Token,然后去后臺(tái)匹配相關(guān)內(nèi)容;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于方盈金泰科技(北京)有限公司,未經(jīng)方盈金泰科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310055324.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 基于Elasticsearch的DSL查詢方法
- 一種基于mongo數(shù)據(jù)庫(kù)的搜索系統(tǒng)
- 一種基于Presto和Elasticsearch的SQL查詢方法
- 一種基于Elasticsearch的數(shù)據(jù)處理方法及終端
- 一種Kafka與Elasticsearch數(shù)據(jù)庫(kù)數(shù)據(jù)的互相遷移方法
- 一種Elasticsearch數(shù)據(jù)查詢方法及系統(tǒng)
- 一種基于Elasticsearch的數(shù)據(jù)檢索方法、裝置、設(shè)備、介質(zhì)
- 基于條件下推elasticsearch的hive索引方法
- 一種Elasticsearch索引的加載方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- Elasticsearch搜索引擎的索引創(chuàng)建方法及裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 加密裝置、加密系統(tǒng)、加密方法以及加密程序
- 移動(dòng)終端和方法
- 再加密方法、再加密系統(tǒng)以及再加密裝置
- 加密終端遠(yuǎn)程管理的方法、加密終端及管理器
- 數(shù)據(jù)加密的方法及裝置
- 流媒體數(shù)據(jù)加密、解密方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 加密裝置、加密系統(tǒng)和數(shù)據(jù)的加密方法
- 文件加密、解密方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種車聯(lián)網(wǎng)數(shù)據(jù)加密方法及系統(tǒng)
- 一種服務(wù)數(shù)據(jù)共享云平臺(tái)的數(shù)據(jù)加密方法及系統(tǒng)





