[發明專利]一種增量更新詞庫數據的控制方法及控制裝置在審
| 申請號: | 201811366451.1 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN109542248A | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 李卿;黃修斌 | 申請(專利權)人: | 上海二三四五網絡科技有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F16/36;G06F8/658 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200137 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞庫 增量更新 用戶核心 增量信息 詞庫數據 服務器核心 控制裝置 更新 輸入法詞庫 更新周期 最新版本 | ||
本發明提供了一種增量更新詞庫數據的控制方法,其用于對輸入法詞庫進行增量更新,具體包括如下步驟:a.基于用戶核心詞庫當前版本以及服務器核心詞庫最新版本確定是否需要增量更新,若是,則進入步驟b;b.基于當前版本的用戶核心詞庫以及一個或多個版本的服務器核心詞庫確定增量信息;c.將所述增量信息更新至當前版本的用戶核心詞庫,其通過判斷是否需要增量更新,對于需要增量更新的當前版本用戶核心詞庫,確定增量信息,再將增量信息加入當前版本的用戶核心詞庫,從而實現對用戶核心詞庫的更新,操作簡單,提供了一種更新步驟與更新周期較短的增量更新詞庫數據的控制方法及控制裝置,具有極高的商業價值。
技術領域
本發明屬于輸入法更新技術領域,特別涉及一種增量更新詞庫數據的控制方法及控制裝置。
背景技術
隨著科學技術的日新月異,互聯網在人們生活中起到了非常重要的作用,而目前,進入網頁、app等的主要方式是文字輸入,用戶需要輸入相關網址進入目標網站或者輸入相關關鍵詞搜索所需信息,同時電子文檔的輸入、電子郵件的使用、聊天軟件的使用等均離不開輸入法。
輸入法詞庫的大小,詞庫中包含的詞條數目,詞庫中詞條內容,均是影響用戶輸入時的方便程度的重要因素。以拼音輸入法為例,當用戶想要輸入“魑魅魍魎”這一成語時,如果詞庫中包含這一成語,則用戶只需要一次性輸入該成語的拼音即可,但如果詞庫中不包含該成語,則用戶需要單獨輸入四個字,進行四次輸入并選擇字的操作,非常不快捷,因此詞庫的更新和增量是提升輸入法系統系性能的重要方面。
目前,多數輸入法是通過網絡爬蟲抓取頁面,然后進行分詞處理,再將其中的有效部分制作成詞庫,只有當服務器端生成新版本的詞庫時,客戶端的輸入法詞庫才會更新,因而更新周期較長,流程復雜,且每次更新時,需要重復全部過程,更新周期較慢,對于日新月異的互聯網環境來說,詞庫版本低、詞庫內容陳舊、詞庫詞條數目少等問題均會影響用戶體驗。
需要一種輸入法技術,針對新詞,可以不必每一次均重復全部的更新步驟,而只需增加新詞到詞庫中,從而實現較短的更新周期。
發明內容
針對現有技術存在的技術缺陷,根據本發明的一個方面,提供一種增量更新詞庫數據的控制方法,其用于對輸入法詞庫進行增量更新,具體包括:
a.基于用戶核心詞庫當前版本以及服務器核心詞庫最新版本確定是否需要增量更新,若是,則進入步驟b;
b.基于當前版本的用戶核心詞庫以及一個或多個版本的服務器核心詞庫確定增量信息;
c.將所述增量信息更新至當前版本的用戶核心詞庫。
進一步地,在所述步驟a之前,還包括步驟:
i:將所述服務器核心詞庫版本進行分類,并確定服務器版本為m-n、m-n+1、m-n+2+…m-2、m-1、m,其中,所述m為服務器核心詞庫最新版本,n為服務器核心詞庫原始版本與服務器核心詞庫最新版本之差,所述1≤n;
i i:確定原始版本的服務器核心詞庫與最新版本的服務器核心詞庫中每相鄰版本之間的詞庫增量信息S,即S1、S2、S3、S4…Sk,其中k為在原始版本的服務器核心詞庫與最新版本的服務器核心詞庫中每相鄰版本之間的詞庫增量信息的個數,所述k等于所述n。
進一步地,所述步驟a還包括:
-當用戶核心詞庫當前版本小于服務器核心詞庫版本時,進入步驟b;
-當用戶核心詞庫當前版本等于服務器核心詞庫版本時,停止更新。
進一步地,所述步驟b包括:
b1:判斷所述用戶核心詞庫是否進行過增量升級,若是,則執行步驟b2,若不是,則執行步驟b3;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海二三四五網絡科技有限公司,未經上海二三四五網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811366451.1/2.html,轉載請聲明來源鉆瓜專利網。





