[發(fā)明專利]一種詞庫的更新方法和裝置在審
| 申請?zhí)枺?/td> | 201611229149.2 | 申請日: | 2016-12-27 |
| 公開(公告)號: | CN106777253A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 姬晨;陳亞堂;張淑燕 | 申請(專利權(quán))人: | 努比亞技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司11270 | 代理人: | 賈偉,張穎玲 |
| 地址: | 518000 廣東省深圳市南山區(qū)高新區(qū)北環(huán)大道9018*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 詞庫 更新 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種詞庫的更新方法和裝置。
背景技術(shù)
Solr是一個獨(dú)立的企業(yè)級搜索應(yīng)用服務(wù)器,使用Solr時,由于Solr自帶的分詞器無法滿足中文分詞問題,為了解決這一問題,需要依賴ik分詞器對搜索或者索引字段進(jìn)行分詞,ik分詞器在分詞時需要依賴其存儲在硬盤中的詞庫。
當(dāng)啟動Solr后,ik分詞器會一次性加載硬盤中的詞庫進(jìn)內(nèi)存,然而,一旦Solr啟動后,對ik詞庫文件的更改,不能實(shí)時加載到內(nèi)存中,在現(xiàn)有技術(shù)中,當(dāng)ik詞庫文件更新后,為了更新內(nèi)存上的詞庫,只能重啟Solr服務(wù),而這種方式會導(dǎo)致用戶在一段時間內(nèi)無法使用Solr進(jìn)行搜索服務(wù)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提出一種詞庫的更新方法和裝置,旨在降低維護(hù)內(nèi)存中的詞庫和擴(kuò)展詞庫的成本,降低了運(yùn)維難度,提升了用戶體驗(yàn)度。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
第一方面,本發(fā)明實(shí)施例提供了一種詞庫的更新方法,所述方法包括:在啟動服務(wù)器之后,將硬盤中的詞庫加載至內(nèi)存中;每隔預(yù)設(shè)時間段檢測所述硬盤中的詞庫的修改時間;在上一次檢測到的修改時間與當(dāng)前檢測到的修改時間不同時,更新所述內(nèi)存中的詞庫。
進(jìn)一步地,所述更新所述內(nèi)存中的詞庫,包括:調(diào)用預(yù)設(shè)的更新函數(shù)將所述內(nèi)存中的詞庫更新為所述硬盤中的詞庫。
進(jìn)一步地,所述更新所述內(nèi)存中的詞庫包括:獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:刪除記錄;刪除所述內(nèi)存中的詞庫中所述刪除記錄中的分詞。
進(jìn)一步地,所述更新所述內(nèi)存中的詞庫包括:獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:添加記錄;將所述添加記錄中的分詞添加至所述內(nèi)存中的詞庫中。
進(jìn)一步地,所述更新所述內(nèi)存中的詞庫包括:獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:更換記錄;根據(jù)所述更換記錄中的被更換分詞查找到所述內(nèi)存中的詞庫中的被更換分詞,將所述內(nèi)存中的詞庫中的被更換分詞更新為所述更換記錄中的更換分詞。
第二方面,本發(fā)明實(shí)施例提供了一種詞庫的更新裝置,所述裝置包括:加載模塊,用于在啟動服務(wù)器之后,將硬盤中的詞庫加載至內(nèi)存中;檢測模塊,用于每隔預(yù)設(shè)時間段檢測所述硬盤中的詞庫的修改時間;更新模塊,用于在上一次檢測到的修改時間與當(dāng)前檢測到的修改時間不同時,更新所述內(nèi)存中的詞庫。
進(jìn)一步地,所述更新模塊,具體用于調(diào)用預(yù)設(shè)的更新函數(shù)將所述內(nèi)存中的詞庫更新為所述硬盤中的詞庫。
進(jìn)一步地,所述更新模塊,具體用于獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:刪除記錄;所述更新模塊,還用于刪除所述內(nèi)存中的詞庫中所述刪除記錄中的分詞。
進(jìn)一步地,所述更新模塊,具體用于獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:添加記錄;所述更新模塊,還用于將所述添加記錄中的分詞添加至所述內(nèi)存中的詞庫中。
進(jìn)一步地,所述更新模塊,具體用于獲取所述硬盤中的詞庫的狀態(tài)信息;其中,所述硬盤中的詞庫的狀態(tài)信息為:更換記錄;所述更新模塊,還用于根據(jù)所述更換記錄中的被更換分詞查找到所述內(nèi)存中的詞庫中的被更換分詞,將所述內(nèi)存中的詞庫中的被更換分詞更新為所述更換記錄中的更換分詞。
本發(fā)明實(shí)施例所提供的一種詞庫的更新方法和裝置,在啟動服務(wù)器之后,首先,將硬盤中的詞庫加載至內(nèi)存中,從而方便分詞器使用內(nèi)存中的詞庫,然后,每隔預(yù)設(shè)時間段檢測硬盤中的詞庫的修改時間,在上一次檢測到的修改時間與當(dāng)前檢測到的修改時間不同時,更新內(nèi)存中的詞庫,也就是說,本發(fā)明實(shí)施例中,通過每隔預(yù)設(shè)時間段檢測硬盤中的詞庫的修改時間,可以及時地知曉硬盤中詞庫的當(dāng)前狀態(tài),通過對硬盤中的詞庫的修改時間的定時檢測,使得內(nèi)存中的詞庫能夠得到及時地更新,避免了重啟服務(wù)器所導(dǎo)致的用戶在一段時間內(nèi)無法使用服務(wù)器,并且,降低維護(hù)內(nèi)存中的詞庫和擴(kuò)展詞庫的成本,同時降低了運(yùn)維難度,進(jìn)而提升了用戶體驗(yàn)度。
附圖說明
圖1為實(shí)現(xiàn)本發(fā)明各個實(shí)施例的一種可選的終端的硬件結(jié)構(gòu)示意圖;
圖2為如圖1所示的移動終端的無線通信系統(tǒng)示意圖;
圖3為本發(fā)明實(shí)施例一中的詞庫的更新方法的流程示意圖;
圖4為本發(fā)明實(shí)施例二中的詞庫的更新方法的一種可選的流程示意圖;
圖5為本發(fā)明實(shí)施例二中的詞庫的更新方法的另一種可選的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于努比亞技術(shù)有限公司,未經(jīng)努比亞技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611229149.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





