[發(fā)明專利]組詞方法和裝置、用于組詞的裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710861480.4 | 申請(qǐng)日: | 2017-09-21 |
| 公開(kāi)(公告)號(hào): | CN109542243B | 公開(kāi)(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 左艷波 | 申請(qǐng)(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號(hào): | G06F3/023 | 分類號(hào): | G06F3/023 |
| 代理公司: | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 方法 裝置 用于 | ||
本發(fā)明實(shí)施例提供了一種組詞方法和裝置、用于組詞的裝置,其中的方法具體包括:接收用戶的輸入串;若所述輸入串在預(yù)置數(shù)據(jù)集的命中情況符合預(yù)置條件,則根據(jù)所述輸入串獲取符合組合規(guī)則的組詞路徑,作為組詞候選;其中,所述預(yù)置數(shù)據(jù)集包括:字集和所述字集對(duì)應(yīng)的編碼單元集。本發(fā)明實(shí)施例可以提高組詞的成功率,且可以提高組詞候選的合理性和質(zhì)量,進(jìn)而可以提高用戶的輸入效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)信息輸入技術(shù)領(lǐng)域,特別是涉及一種組詞方法和裝置、以及一種用于組詞的裝置。
背景技術(shù)
目前,涉及交互的設(shè)備,通常需要用戶通過(guò)輸入法程序?qū)⒆约旱牟僮饕鈭D與設(shè)備交互識(shí)別。例如,用戶可以輸入輸入串,然后由輸入法程序依據(jù)其預(yù)置的標(biāo)準(zhǔn)映射規(guī)則將該輸入串轉(zhuǎn)換為相應(yīng)語(yǔ)言的候選項(xiàng)并展示,進(jìn)而將用戶選擇的候選項(xiàng)上屏。
當(dāng)詞庫(kù)中不存在輸入串直接命中的詞條時(shí),輸入法程序可以觸發(fā)組詞功能。現(xiàn)有的組詞過(guò)程具體為:查找多元庫(kù)中的多元關(guān)系,該依據(jù)該多元關(guān)系的命中情況計(jì)算每個(gè)組詞方案中詞匯串的路徑概率,并將具有最大路徑概率的組詞方案作為首選項(xiàng)返回給用戶。其中,該多元關(guān)系是指詞匯與詞匯之間的搭配關(guān)系,如“天氣-好熱”、“我-知道”、“喜歡-你”、“十萬(wàn)-八千”等可以具有二元關(guān)系。組詞功能非常重要,組詞結(jié)果的好壞可以影響輸入法程序的質(zhì)量,也將影響到用戶的體驗(yàn)。
在實(shí)際應(yīng)用中,由于數(shù)字和單位對(duì)應(yīng)的組合為無(wú)限集,故對(duì)于包含數(shù)字和單位的組詞,往往需要非常多的多元關(guān)系。然而,一方面,受限于存儲(chǔ)空間,存儲(chǔ)的多元關(guān)系有限;另一方面,多元庫(kù)中存儲(chǔ)的多元關(guān)系往往是通過(guò)統(tǒng)計(jì)學(xué)習(xí)的方式得到,通常存儲(chǔ)的多元關(guān)系很難保證能夠覆蓋所有的情況。這樣,在組詞過(guò)程中若無(wú)法命中多元庫(kù)中的多元關(guān)系,將導(dǎo)致組詞失敗。例如,若多元庫(kù)中未存儲(chǔ)“一億零八萬(wàn)九千”,則輸入串“yiyilingbawanjiuqian”對(duì)應(yīng)的詞匯“一億”、“零”、“八萬(wàn)”、“九千”等將無(wú)法命中多元庫(kù)中的多元關(guān)系,進(jìn)而導(dǎo)致組詞失敗。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明實(shí)施例以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的組詞方法、組詞裝置、用于組詞的裝置,本發(fā)明實(shí)施例可以提高組詞的成功率,且可以提高組詞候選的合理性和質(zhì)量,進(jìn)而可以提高用戶的輸入效率。
為了解決上述問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了一種組詞方法,包括:
接收用戶的輸入串;
若所述輸入串在預(yù)置數(shù)據(jù)集的命中情況符合預(yù)置條件,則根據(jù)所述輸入串獲取符合組合規(guī)則的組詞路徑,作為組詞候選;其中,所述預(yù)置數(shù)據(jù)集包括:字集和所述字集對(duì)應(yīng)的編碼單元集。
另一方面,本發(fā)明實(shí)施例公開(kāi)了一種組詞裝置,包括:
輸入串接收模塊,用于接收用戶的輸入串;以及
組詞候選獲取模塊,用于若所述輸入串在預(yù)置數(shù)據(jù)集的命中情況符合預(yù)置條件,則根據(jù)所述輸入串獲取符合組合規(guī)則的組詞路徑,作為組詞候選;其中,所述預(yù)置數(shù)據(jù)集包括:字集和所述字集對(duì)應(yīng)的編碼單元集。
可選地,所述裝置還包括:
判斷模塊,用于判斷所述輸入串在預(yù)置數(shù)據(jù)集的命中情況是否符合預(yù)置條件:
所述判斷模塊,包括:
切分子模塊,用于對(duì)所述輸入串進(jìn)行切分,得到對(duì)應(yīng)的切分結(jié)果;
判斷子模塊,用于判斷所述輸入串對(duì)應(yīng)的切分結(jié)果是否命中所述預(yù)置數(shù)據(jù)集。
可選地,所述組詞候選獲取模塊包括:
查找子模塊,用于依據(jù)所述切分結(jié)果,在編碼單元集與字集之間的映射關(guān)系中進(jìn)行查找,以得到與所述切分結(jié)果相匹配的單字,作為所述輸入串對(duì)應(yīng)的待組單字;
路徑確定子模塊,用于依據(jù)所述輸入串對(duì)應(yīng)的待組單字,確定組詞路徑;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710861480.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種鍵盤(pán)支架
- 下一篇:一種輸入方法、裝置和介質(zhì)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





