[發明專利]添加自定義分詞的方法及裝置在審
| 申請號: | 201710364767.6 | 申請日: | 2017-05-22 |
| 公開(公告)號: | CN107169115A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 劉慶 | 申請(專利權)人: | 深圳市連用科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司44414 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳市福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 添加 自定義 分詞 方法 裝置 | ||
技術領域
本發明屬于計算機技術領域,尤其涉及一種添加自定義分詞的方法及裝置。
背景技術
隨著互聯網數據規模的爆炸式增長,如何從海量的歷史、實時數據中快速獲取有用信息,變得越來越具有挑戰性。搜索是獲取信息最高效的途徑之一,因此也是各類網站或者應用的基礎標配功能。然而僅有強大的搜索引擎是不夠的,還需要制訂滿足個人需要的個性化詞庫,而往往有些標準詞庫無法完美的達到預期效果,因此需要建立自定義分詞庫。
目前大部分中文分詞插件包括bigdesk、head、inquisitor、marvel、kopf都是對索引進行瀏覽、查看或分析等,而IKAnalyzer(輕量級的中文分詞插件)作為比較流行的中文分詞插件卻沒有對添加自定義分詞做很好的支持?,F有的IKAnalyzer需要在添加自定義分詞后重啟整個ElasticSearch服務器才能加載到剛剛加入到自定義分詞庫的詞。如果是在一個非常龐大的ElasticSearch集群環境,節點數可能達到幾十甚至上百個節點,那么每個提供索引服務的節點都需要編輯更新下自定義分詞庫然后重啟,然而ElasticSearch服務器重啟的過程需要一段時間的等待,這將浪費時間。
綜上可知,目前添加自定義分詞的方法存在操作效率低的問題。
發明內容
有鑒于此,本發明實施例提供了添加自定義分詞的方法及裝置,以解決現有技術中添加自定義分詞的方法存在操作效率低的問題。
本發明實施例的第一方面提供了一種添加自定義分詞的方法,包括:
監聽自定義錄入請求;所述自定義錄入請求至少包括自定義分詞錄入表單,所述自定義分詞錄入表單至少包括自定義分詞;
在監聽到自定義錄入請求時,通過自定義分詞追加函數將所述自定義分詞寫入自定義分詞庫中。
本發明實施例的第二方面提供了一種添加自定義分詞的裝置,包括:
監聽單元,用于監聽自定義錄入請求;所述自定義錄入請求至少包括自定義分詞錄入表單,所述自定義分詞錄入表單至少包括自定義分詞;
寫入單元,用于在監聽到自定義錄入請求時,通過自定義分詞追加函數將所述自定義分詞寫入自定義分詞庫中。
本發明實施例的第三方面提供了一種終端設備,包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現以下步驟:
監聽自定義錄入請求;所述自定義錄入請求至少包括自定義分詞錄入表單,所述自定義分詞錄入表單至少包括自定義分詞;
在監聽到自定義錄入請求時,通過自定義分詞追加函數將所述自定義分詞寫入自定義分詞庫中。
本發明實施例的第四方面提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現以下步驟:
監聽自定義錄入請求;所述自定義錄入請求至少包括自定義分詞錄入表單,所述自定義分詞錄入表單至少包括自定義分詞;
在監聽到自定義錄入請求時,通過自定義分詞追加函數將所述自定義分詞寫入自定義分詞庫中。
本發明實施例通過監聽自定義錄入請求,在監聽到自定義錄入請求時,通過自定義分詞追加函數將所述自定義分詞寫入自定義分詞庫中,新添加到自定義分詞庫中的詞立即生效,因此無需重啟服務器,節省了時間,提高了操作效率。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例一提供的添加自定義分詞的方法的實現流程示意圖;
圖2是本發明實施例二提供的添加自定義分詞的方法的實現流程示意圖;
圖3是本發明實施例二中步驟S205的具體實現流程示意圖;
圖4是本發明實施例四提供的添加自定義分詞的方法的實現流程示意圖;
圖5是本發明實施例提供的添加自定義分詞的裝置的示意圖;
圖6是本發明實施例提供的終端設備的示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市連用科技有限公司,未經深圳市連用科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710364767.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種海量數據多維排序搜索方法
- 下一篇:默認搜索詞的生成方法及裝置





