[發(fā)明專利]輸入法詞頻調(diào)整方法及裝置在審
| 申請?zhí)枺?/td> | 202110357086.3 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN113177403A | 公開(公告)日: | 2021-07-27 |
| 發(fā)明(設(shè)計)人: | 沈哲吉;賈昌鑫;朱相宇;王映新 | 申請(專利權(quán))人: | 北京華宇信息技術(shù)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F3/023;G06F40/289 |
| 代理公司: | 北京中索知識產(chǎn)權(quán)代理有限公司 11640 | 代理人: | 胡大成 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)村*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輸入法 詞頻 調(diào)整 方法 裝置 | ||
本申請公開了一種輸入法詞頻調(diào)整方法及裝置,用以解決輸入法詞組詞頻調(diào)整效果差的技術(shù)問題。一種輸入法詞頻調(diào)整方法,包括以下步驟:獲取語料數(shù)據(jù);通過分詞模型,對所述語料數(shù)據(jù)進行分詞,生成若干分詞單元;通過識音模型,對所述分詞單元進行注音,生成分詞單元音節(jié);將音節(jié)相同的分詞單元保存至同一音節(jié)詞庫;統(tǒng)計同一音節(jié)詞庫中第一分詞單元的出現(xiàn)概率;將所述第一分詞單元的出現(xiàn)概率與預(yù)設(shè)閾值進行比較,得到比較結(jié)果;根據(jù)比較結(jié)果,調(diào)整第一分詞單元的詞頻;根據(jù)調(diào)整后所述第一分詞單元的詞頻,以預(yù)設(shè)順序排列第一分詞單元所在音節(jié)詞庫的分詞單元順序,更新音節(jié)詞庫。通過對同一音節(jié)詞庫中詞組的詞頻進行動態(tài)調(diào)整,提高了輸入的準確性。
技術(shù)領(lǐng)域
本申請涉及輸入技術(shù)領(lǐng)域,尤其涉及一種輸入法詞頻調(diào)整方法及裝置。
背景技術(shù)
隨著社會經(jīng)濟、文化和科技水平的不斷發(fā)展和提高,人們?nèi)粘J褂玫脑~匯和專業(yè)領(lǐng)域的詞匯也在不斷發(fā)展。這導致了許多新詞迅速涌現(xiàn)、快速迭代。為了使輸入法能夠適應(yīng)新詞的出現(xiàn),需要對輸入法中詞組詞頻進行及時調(diào)整。而輸入法詞頻的有效調(diào)整,能夠極大地提高輸入法的準確性和及時性。
在實現(xiàn)現(xiàn)有技術(shù)的過程中,發(fā)明人發(fā)現(xiàn):
現(xiàn)有技術(shù)中,輸入法常通過詞組的系數(shù)改變詞頻。該方法對于新詞組缺乏有效的調(diào)整機制。因為該方法對于初始詞頻非常敏感,過低或者過高的初始詞頻,都不利于新詞在詞庫中的排序。并且,隨著時間的推移,原有詞組的詞頻也不再適合當前用戶輸入習慣。從而影響輸入的準確性。
因此,需要提供一種輸入法詞頻調(diào)整方法及裝置,用以解決輸入法詞組詞頻調(diào)整效果差的技術(shù)問題。
發(fā)明內(nèi)容
本申請實施例提供一種輸入法詞頻調(diào)整方法及裝置,用以解決輸入法詞組詞頻調(diào)整效果差的技術(shù)問題。
具體的,一種輸入法詞頻調(diào)整方法,包括以下步驟:
獲取語料數(shù)據(jù);
通過分詞模型,對所述語料數(shù)據(jù)進行分詞,生成若干分詞單元;
通過識音模型,對所述分詞單元進行注音,生成分詞單元音節(jié);
將音節(jié)相同的分詞單元保存至同一音節(jié)詞庫;
統(tǒng)計同一音節(jié)詞庫中第一分詞單元的出現(xiàn)概率;
將所述第一分詞單元的出現(xiàn)概率與預(yù)設(shè)閾值進行比較,得到比較結(jié)果;
根據(jù)比較結(jié)果,調(diào)整第一分詞單元的詞頻;
根據(jù)調(diào)整后所述第一分詞單元的詞頻,以預(yù)設(shè)順序排列第一分詞單元所在音節(jié)詞庫的分詞單元順序,更新音節(jié)詞庫。
進一步的,根據(jù)比較結(jié)果,調(diào)整第一分詞單元的詞頻,具體包括:
當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率大于、等于預(yù)設(shè)閾值,增強所述第一分詞單元的詞頻;
當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率小于預(yù)設(shè)閾值,衰弱所述第一分詞單元的詞頻。
進一步的,當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率大于、等于預(yù)設(shè)閾值,增強所述第一分詞單元的詞頻,具體包括:
根據(jù)所述第一分詞單元在同一音節(jié)詞庫中的出現(xiàn)概率,計算所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù);其表示如下:
式中,ak,i為所述第一分詞單元wi在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),P(wi|s)為第一分詞單元wi在同一音節(jié)s詞庫中的出現(xiàn)概率;
根據(jù)所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),計算所述第一分詞單元在第K輪調(diào)整中的詞頻權(quán)重系數(shù);其表示如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京華宇信息技術(shù)有限公司,未經(jīng)北京華宇信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110357086.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設(shè)備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)





