[發(fā)明專(zhuān)利]一種糾錯(cuò)詞庫(kù)的建立方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710570569.5 | 申請(qǐng)日: | 2017-07-13 |
| 公開(kāi)(公告)號(hào): | CN109271037B | 公開(kāi)(公告)日: | 2022-09-09 |
| 發(fā)明(設(shè)計(jì))人: | 左艷波 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類(lèi)號(hào): | G06F3/023 | 分類(lèi)號(hào): | G06F3/023 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 糾錯(cuò) 詞庫(kù) 建立 方法 裝置 | ||
1.一種糾錯(cuò)詞庫(kù)的建立方法,其特征在于,所述方法包括:
識(shí)別用戶輸入字符串的輸入行為,所輸入的字符串對(duì)應(yīng)至少一個(gè)候選字;
若識(shí)別出所述用戶未選擇第一輸入行為中第一字符串對(duì)應(yīng)的候選字,而選擇了第二輸入行為中第二字符串對(duì)應(yīng)的候選字,保存所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系,所述第二輸入行為是后于所述第一輸入行為產(chǎn)生的、且與所述第一輸入行為相鄰產(chǎn)生的輸入行為,所述第一字符串在所述第一輸入行為輸入字符串中所處的音節(jié)位置與所述第二字符串在所述第二輸入行為輸入字符串中所處的音節(jié)位置相同;
根據(jù)所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系建立針對(duì)所述用戶的糾錯(cuò)詞庫(kù);所述糾錯(cuò)詞庫(kù)與使用輸入法的用戶一一對(duì)應(yīng);
若獲取了所述用戶輸入的所述第一字符串,根據(jù)所述第一字符串從所述糾錯(cuò)詞庫(kù)查詢得到所述第二字符串;
將所述第二字符串對(duì)應(yīng)的候選字作為所述用戶輸入的所述第一字符串對(duì)應(yīng)的候選字;
根據(jù)所述第二字符串對(duì)應(yīng)的候選字被選擇上屏的熱度,從所述第二字符串對(duì)應(yīng)的候選字中選擇高熱度的部分候選字,并將所述部分候選字的熱度與所述第一字符串對(duì)應(yīng)的候選字的熱度進(jìn)行比較,根據(jù)各個(gè)候選字的熱度高低來(lái)調(diào)整所述第一字符串對(duì)應(yīng)的候選字的展示位置,在所述第一字符串對(duì)應(yīng)的候選字展示界面中的部分候選字展示位置展示所述第二字符串對(duì)應(yīng)的候選字中熱度最高的候選字,所述候選字展示界面為用于展示候選字的界面,包括了多個(gè)候選字展示位置;所述第二字符串對(duì)應(yīng)的候選字被選擇上屏的熱度,是根據(jù)用戶個(gè)人在輸錯(cuò)場(chǎng)景下的輸入行為數(shù)據(jù)統(tǒng)計(jì)得到的,所述輸錯(cuò)場(chǎng)景是指是所述用戶未選擇第一輸入行為中第一字符串對(duì)應(yīng)的候選字,而選擇了第二輸入行為中第二字符串對(duì)應(yīng)的候選字的情況。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述保存所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系,包括:
記錄識(shí)別出所述用戶未選擇第一輸入行為中第一字符串對(duì)應(yīng)的候選字,而選擇了第二輸入行為中第二字符串對(duì)應(yīng)的候選字的次數(shù);
若所述次數(shù)滿足閾值,保存所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二字符串為在所述第一輸入行為中所輸入第一字符串的基礎(chǔ)上修改得到的;或者
所述第二字符串為在取消了所述第一輸入行為所輸入字符串后輸入的。
4.一種糾錯(cuò)詞庫(kù)的建立裝置,其特征在于,所述裝置包括識(shí)別單元、保存單元、建立單元替換單元、查詢單元和展示單元:
所述識(shí)別單元,用于識(shí)別用戶輸入字符串的輸入行為,所輸入的字符串對(duì)應(yīng)至少一個(gè)候選字;
所述保存單元,用于若所述識(shí)別單元識(shí)別出所述用戶未選擇第一輸入行為中第一字符串對(duì)應(yīng)的候選字,而選擇了第二輸入行為中第二字符串對(duì)應(yīng)的候選字,保存所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系,所述第二輸入行為是后于所述第一輸入行為產(chǎn)生的、且與所述第一輸入行為相鄰產(chǎn)生的輸入行為,所述第一字符串在所述第一輸入行為輸入字符串中所處的音節(jié)位置與所述第二字符串在所述第二輸入行為輸入字符串中所處的音節(jié)位置相同;
所述建立單元,用于根據(jù)所述第一字符串與第二字符串的對(duì)應(yīng)關(guān)系建立針對(duì)所述用戶的糾錯(cuò)詞庫(kù);所述糾錯(cuò)詞庫(kù)與使用輸入法的用戶一一對(duì)應(yīng);
所述查詢單元,用于若獲取了所述用戶輸入的所述第一字符串,根據(jù)所述第一字符串從所述糾錯(cuò)詞庫(kù)查詢得到所述第二字符串;
所述替換單元,用于將所述第二字符串對(duì)應(yīng)的候選字作為所述用戶輸入的所述第一字符串對(duì)應(yīng)的候選字;
所述展示單元,用于根據(jù)所述第二字符串對(duì)應(yīng)的候選字被選擇上屏的熱度,從所述第二字符串對(duì)應(yīng)的候選字中選擇高熱度的部分候選字,并將所述部分候選字的熱度與所述第一字符串對(duì)應(yīng)的候選字的熱度進(jìn)行比較,根據(jù)各個(gè)候選字的熱度高低來(lái)調(diào)整所述第一字符串對(duì)應(yīng)的候選字的展示位置,在所述第一字符串對(duì)應(yīng)的候選字展示界面中的部分候選字展示位置展示所述第二字符串對(duì)應(yīng)的候選字中熱度最高的候選字,所述候選字展示界面為用于展示候選字的界面,包括了多個(gè)候選字展示位置;所述第二字符串對(duì)應(yīng)的候選字被選擇上屏的熱度,是根據(jù)用戶個(gè)人在輸錯(cuò)場(chǎng)景下的輸入行為數(shù)據(jù)統(tǒng)計(jì)得到的,所述輸錯(cuò)場(chǎng)景是指是所述用戶未選擇第一輸入行為中第一字符串對(duì)應(yīng)的候選字,而選擇了第二輸入行為中第二字符串對(duì)應(yīng)的候選字的情況。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710570569.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 用戶詞庫(kù)管理系統(tǒng)和管理方法
- 一種分類(lèi)詞庫(kù)系統(tǒng)及其更新和維護(hù)方法、以及客戶端
- 詞庫(kù)替換方法、裝置及輸入法系統(tǒng)
- 一種基于位置的輸入法詞庫(kù)管理系統(tǒng)及方法
- 詞庫(kù)、詞庫(kù)的處理方法、裝置和用于處理詞庫(kù)的裝置
- 一種詞庫(kù)更新方法及裝置
- 一種詞庫(kù)的生成方法、裝置、終端設(shè)備和服務(wù)器
- 用于語(yǔ)音對(duì)話平臺(tái)的詞庫(kù)管理方法和系統(tǒng)
- 一種詞庫(kù)維護(hù)管理方法、裝置
- 一種詞庫(kù)構(gòu)建方法及計(jì)算設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





