[發(fā)明專利]輸入法詞頻調(diào)整方法及裝置在審
| 申請?zhí)枺?/td> | 202110357086.3 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN113177403A | 公開(公告)日: | 2021-07-27 |
| 發(fā)明(設計)人: | 沈哲吉;賈昌鑫;朱相宇;王映新 | 申請(專利權(quán))人: | 北京華宇信息技術(shù)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F3/023;G06F40/289 |
| 代理公司: | 北京中索知識產(chǎn)權(quán)代理有限公司 11640 | 代理人: | 胡大成 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)村*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輸入法 詞頻 調(diào)整 方法 裝置 | ||
1.一種輸入法詞頻調(diào)整方法,其特征在于,包括以下步驟:
獲取語料數(shù)據(jù);
通過分詞模型,對所述語料數(shù)據(jù)進行分詞,生成若干分詞單元;
通過識音模型,對所述分詞單元進行注音,生成分詞單元音節(jié);
將音節(jié)相同的分詞單元保存至同一音節(jié)詞庫;
統(tǒng)計同一音節(jié)詞庫中第一分詞單元的出現(xiàn)概率;
將所述第一分詞單元的出現(xiàn)概率與預設閾值進行比較,得到比較結(jié)果;
根據(jù)比較結(jié)果,調(diào)整第一分詞單元的詞頻;
根據(jù)調(diào)整后所述第一分詞單元的詞頻,以預設順序排列第一分詞單元所在音節(jié)詞庫的分詞單元順序,更新音節(jié)詞庫。
2.如權(quán)利要求1所述的輸入法詞頻調(diào)整方法,其特征在于,根據(jù)比較結(jié)果,調(diào)整第一分詞單元的詞頻,具體包括:
當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率大于、等于預設閾值,增強所述第一分詞單元的詞頻;
當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率小于預設閾值,衰弱所述第一分詞單元的詞頻。
3.如權(quán)利要求2所述的輸入法詞頻調(diào)整方法,其特征在于,當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率大于、等于預設閾值,增強所述第一分詞單元的詞頻,具體包括:
根據(jù)所述第一分詞單元在同一音節(jié)詞庫中的出現(xiàn)概率,計算所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù);其表示如下:
式中,ak,i為所述第一分詞單元wi在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),P(wi|s)為第一分詞單元wi在同一音節(jié)s詞庫中的出現(xiàn)概率;
根據(jù)所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),計算所述第一分詞單元在第K輪調(diào)整中的詞頻權(quán)重系數(shù);其表示如下:
式中,ek,i為所述第一分詞單元wi在第K輪調(diào)整中的詞頻權(quán)重系數(shù),ak,i為所述第一分詞單元wi在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù);
根據(jù)所述第一分詞單元在第K輪調(diào)整中的詞頻權(quán)重系數(shù),計算所述第一分詞單元在第K+1輪調(diào)整中的詞頻;其表示如下:
式中,freqk+1,i為第一分詞單元wi在第K+1輪調(diào)整中的詞頻,ek,i為所述第一分詞單元wi在第K輪調(diào)整中的詞頻權(quán)重系數(shù),Zk為所述第一分詞單元wi的詞頻更新,且
4.如權(quán)利要求2所述的輸入法詞頻調(diào)整方法,其特征在于,當?shù)谝环衷~單元在同一音節(jié)詞庫中的出現(xiàn)概率小于預設閾值,衰弱所述第一分詞單元的詞頻,具體包括:
根據(jù)所述第一分詞單元在同一音節(jié)詞庫中的出現(xiàn)概率,計算所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù);其表示如下:
式中,ak,i為所述第一分詞單元wi在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),P(wi|s)為所述第一分詞單元wi在同一音節(jié)s詞庫中的出現(xiàn)概率;
根據(jù)所述第一分詞單元在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù),計算所述第一分詞單元在第K輪調(diào)整中的詞頻權(quán)重系數(shù);其表示如下:
式中,ek,i為所述第一分詞單元wi在第K輪調(diào)整中的詞頻權(quán)重系數(shù),ak,i為所述第一分詞單元wi在第K輪調(diào)整中的調(diào)整權(quán)重系數(shù);
根據(jù)所述第一分詞單元在第K輪調(diào)整中的詞頻權(quán)重系數(shù),計算所述第一分詞單元在第K+1輪調(diào)整中的詞頻;其表示如下:
式中,freqk+1,i為第一分詞單元wi在第K+1輪調(diào)整中的詞頻,ek,i為所述第一分詞單元wi在第K輪調(diào)整中的詞頻權(quán)重系數(shù),Zk為所述第一分詞單元wi的詞頻更新,且
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京華宇信息技術(shù)有限公司,未經(jīng)北京華宇信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110357086.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)





