日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種確定漢字拼音的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)在審

專利信息
申請(qǐng)?zhí)枺?/td> 201811312773.8 申請(qǐng)日: 2018-11-06
公開(公告)號(hào): CN111142681A 公開(公告)日: 2020-05-12
發(fā)明(設(shè)計(jì))人: 胡娟;陳歡;宋奇 申請(qǐng)(專利權(quán))人: 北京嘀嘀無限科技發(fā)展有限公司
主分類號(hào): G06F3/023 分類號(hào): G06F3/023
代理公司: 成都七星天知識(shí)產(chǎn)權(quán)代理有限公司 51253 代理人: 袁春曉
地址: 100193 北京市*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 確定 漢字 拼音 方法 系統(tǒng) 裝置 存儲(chǔ) 介質(zhì)
【說明書】:

發(fā)明提供了一種漢字拼音確定方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)。所述方法包括以下一個(gè)或一個(gè)以上操作。可以獲取待確定拼音的輸入數(shù)據(jù)。可以基于拼音確定模型獲取所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值,所述概率值為對(duì)應(yīng)候選拼音結(jié)果為所述輸入數(shù)據(jù)的發(fā)音的概率。可以將概率值最大的候選拼音結(jié)果確定為所述輸入數(shù)據(jù)的目標(biāo)拼音。本申請(qǐng)中公開的方法,可以根據(jù)漢字的上下文語境,選擇合適的多音字拼音,解決了常用算法中詞典未覆蓋的多音字詞問題。

技術(shù)領(lǐng)域

本發(fā)明涉及語言處理技術(shù)領(lǐng)域,更具體的,涉及一種確定漢字拼音的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)。

背景技術(shù)

在對(duì)中文漢字進(jìn)行拼音注音時(shí),常用的漢字轉(zhuǎn)拼音的算法依賴于詞典,包括詞語映射拼音詞典和單個(gè)字映射拼音詞典。對(duì)于既有詞典,無法覆蓋新出現(xiàn)的詞語,并且在面對(duì)單個(gè)字(或多音字)轉(zhuǎn)拼音時(shí),無法根據(jù)該字的具體上下文語境靈活的選擇拼音,只能根據(jù)設(shè)定好的位置去確定該字的多個(gè)讀音中的一個(gè)。這樣得到的漢字轉(zhuǎn)拼音的正確率較低。因此,需要一種可根據(jù)上下文語境確定漢字拼音的方法。

發(fā)明內(nèi)容

針對(duì)現(xiàn)有技術(shù)中在進(jìn)行漢字轉(zhuǎn)拼音時(shí),無法根據(jù)上下文靈活選擇正確拼音的問題,本發(fā)明的一個(gè)實(shí)施例在于提供一種確定漢字拼音的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì),首先確定待轉(zhuǎn)拼音的漢字的所有讀音,進(jìn)一步基于由訓(xùn)練語料對(duì)訓(xùn)練完成的拼音確定模型獲取拼音對(duì)應(yīng)待轉(zhuǎn)漢字的概率值,基于概率值確定待轉(zhuǎn)拼音的漢字的拼音結(jié)果,提高了漢字轉(zhuǎn)拼音的準(zhǔn)確性。

為了達(dá)到上述發(fā)明的目的,本發(fā)明提供的技術(shù)方案如下:

一種確定漢字讀音的方法。所述方法在可以在包括一個(gè)處理器和一個(gè)存儲(chǔ)器的設(shè)備上實(shí)現(xiàn)。所述方法可以包括以下一個(gè)或一個(gè)以上操作。可以獲取待確定拼音的輸入數(shù)據(jù)。可以對(duì)所述輸入數(shù)據(jù)進(jìn)行處理,獲取所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值,所述概率值為對(duì)應(yīng)候選拼音結(jié)果為所述輸入數(shù)據(jù)的發(fā)音的概率。可以將概率值最大的候選拼音結(jié)果確定為所述輸入數(shù)據(jù)的目標(biāo)拼音,并輸入所述目標(biāo)拼音。

在本發(fā)明中,所述對(duì)所述輸入數(shù)據(jù)進(jìn)行處理,獲取所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值,可以包括以下一個(gè)或一個(gè)以上的操作。可以基于狀態(tài)轉(zhuǎn)移矩陣及發(fā)射矩陣確定所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值。所述狀態(tài)轉(zhuǎn)移矩陣包含訓(xùn)練語料中全部漢字的拼音組成的集合中,任意一個(gè)拼音轉(zhuǎn)移到集合中其他拼音的概率值以及轉(zhuǎn)移到其自身的概率值。所述發(fā)射矩陣包含所述集合中任意一個(gè)拼音對(duì)應(yīng)的漢字取訓(xùn)練語料中各漢字的概率值。所述訓(xùn)練語料包括多條由含有漢字的文本及其對(duì)應(yīng)的拼音組成的語料對(duì)。

在本發(fā)明中,所述基于狀態(tài)轉(zhuǎn)移矩陣及發(fā)射矩陣確定所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值,可以包括以下一個(gè)或一個(gè)以上操作。可以確定所述輸入數(shù)據(jù)的觀察序列;所述觀察序列是將所述輸入數(shù)據(jù)對(duì)應(yīng)的文本拆分成單個(gè)字符后的字符序列。確定所述觀察序列中每個(gè)字符的狀態(tài)序列;其中,漢字字符的狀態(tài)序列包含該漢字的全部拼音,數(shù)字字符、字母字符與符號(hào)字符的狀態(tài)序列均為其本身。可以基于所述狀態(tài)轉(zhuǎn)移矩陣以及所述發(fā)射矩陣確定所述觀察序列中每個(gè)漢字字符取其狀態(tài)序列中不同拼音的概率值,得到所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果及其對(duì)應(yīng)的概率值。

在本發(fā)明中,所述將概率值最大的候選拼音結(jié)果確定為所述輸入數(shù)據(jù)的目標(biāo)拼音,可以包括以下一個(gè)或一個(gè)以上操作。可以保留所述觀察序列中每個(gè)漢字字符的狀態(tài)序列中概率值最大的拼音,得到所述輸入數(shù)據(jù)的目標(biāo)拼音。

一種確定漢字拼音系統(tǒng)。所述系統(tǒng)包括獲取模塊、候選拼音確定模塊以及目標(biāo)拼音確定模塊。所述獲取模塊用于獲取待確定拼音的輸入數(shù)據(jù)。所述候選拼音確定模塊用于對(duì)所述輸入數(shù)據(jù)進(jìn)行處理,獲取所述輸入數(shù)據(jù)的至少一種候選拼音結(jié)果,以及每一種候選拼音結(jié)果對(duì)應(yīng)的概率值,所述概率值為對(duì)應(yīng)候選拼音結(jié)果為所述輸入數(shù)據(jù)的發(fā)音的概率。所述目標(biāo)拼音確定模塊用于將概率值最大的候選拼音結(jié)果確定為所述輸入數(shù)據(jù)的目標(biāo)拼音。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京嘀嘀無限科技發(fā)展有限公司,未經(jīng)北京嘀嘀無限科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811312773.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美一区二区三区白人| 欧美乱妇在线观看| 色天天综合久久久久综合片| 欧美xxxxhdvideos| 91精品一区在线观看| 日韩精品免费一区二区夜夜嗨| 一区二区三区欧美精品| 国产91高清| 国产不卡一区在线| 亚洲国产精品综合| 久久夜靖品2区| 中文字幕在线播放一区| 久久综合国产精品| 电影91久久久| 国产色99| 日韩精品久久一区二区三区| 国产精品欧美一区二区三区| 午夜电影三级| 亚洲少妇一区二区三区| 满春阁精品av在线导航 | 亚洲精品乱码久久久久久写真| 日韩精品免费一区| 性色av色香蕉一区二区| 久久黄色精品视频| 国产一区第一页| 国产日韩欧美精品| 国产欧美日韩精品一区二区三区 | 国产一区二区伦理片| 欧美日韩中文不卡| 性欧美1819sex性高播放| 日韩av在线导航| 久久不卡精品| 欧美一区二区免费视频| 真实的国产乱xxxx在线91| 亚洲精品一区二区三区香蕉| 国产乱人伦精品一区二区三区| 93精品国产乱码久久久| 国产精品日产欧美久久久久| 夜夜夜夜曰天天天天拍国产| 久久久久久久久亚洲精品| 欧美日韩综合一区二区| 高清国产一区二区| 香港日本韩国三级少妇在线观看| 国产91视频一区| 丰满岳乱妇bd在线观看k8| 一区二区三区电影在线观看| 狠狠色噜噜狠狠狠狠色吗综合 | 精品99免费视频| 996久久国产精品线观看| 91一区在线观看| 国产精品久久久久久久久久久久冷| 亚日韩精品| 国产精品久久久久四虎| 91精品久久天干天天天按摩| 免费超级乱淫视频播放| 日韩午夜毛片| av不卡一区二区三区| 国产99久久久精品视频| 午夜激情综合网| 国产88在线观看入口| 91日韩一区二区三区| 在线国产一区二区三区| 91精品国产麻豆国产自产在线| 亚洲国产精品91| 国产www亚洲а∨天堂| 久久国产精品网站| 久久免费视频99| 色一情一乱一乱一区99av白浆| 91日韩一区二区三区| 农村妇女精品一二区| 午夜剧场a级免费| 毛片大全免费看| 亚洲精品少妇一区二区| 午夜精品在线观看| 日韩精品中文字幕在线| 午夜特级片| 国产亚洲精品久久久久秋霞| 免费精品一区二区三区视频日产| 日本一区二区三区四区高清视频| 国产精品久久久久久久久久软件| 少妇中文字幕乱码亚洲影视 | 国产精品久久久久久久久久不蜜月 |