[發明專利]基于深度神經網絡的多音字讀音的判別方法和裝置有效
| 申請號: | 201710876713.8 | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN107729313B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 聶志朋;徐揚凱 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 神經網絡 多音字 讀音 判別 方法 裝置 | ||
1.一種基于深度神經網絡的多音字讀音的判別方法,其特征在于,包括:
對待識別文本中的每個漢字進行量化編碼,根據所述漢字的量化編碼、所述漢字的分詞詞性和分詞邊界,以及所述漢字的多音字標識生成所述漢字的特征向量;
根據所述漢字的特征向量,結合雙向的長短時記憶模型獲取的所述漢字的雙方向的上下文信息,生成所述漢字的輸入特征,所述上下文信息包括所述漢字所屬的句子成分、所述漢字在句子中的位置和所述漢字的上下文文本中各分詞的分詞屬性;
將所述漢字的輸入特征分別輸入聲母、韻母和聲調對應的深層神經網絡模型,分別獲得所述漢字的讀音的聲母對應漢語拼音中每個聲母的第一概率、所述漢字的讀音的韻母對應漢語拼音中每個韻母的第二概率和所述漢字的讀音的聲調對應漢語拼音中每個聲調的第三概率;
根據所述第一概率、所述第二概率和所述第三概率計算所述漢字的讀音對應的聲母、韻母和聲調的各種組合的概率,以概率最高的組合作為所述漢字的讀音。
2.根據權利要求1所述的方法,其特征在于,所述對待識別文本中的每個漢字進行量化編碼包括:
利用語料庫預訓練得到的單字的字向量表示,對待識別文本中的每個漢字進行量化編碼。
3.根據權利要求1所述的方法,其特征在于,所述雙向的長短時記憶模型獲取的所述漢字的雙方向的上下文信息包括:所述漢字的從前至后和從后至前兩個方向的上下文信息。
4.根據權利要求1-3任意一項所述的方法,其特征在于,所述將所述漢字的輸入特征分別輸入聲母、韻母和聲調對應的深層神經網絡模型之前,還包括:
采用標注好的訓練數據分別訓練聲母、韻母和聲調對應的深層神經網絡模型;
當聲母、韻母和聲調對應的深層神經網絡模型的輸出結果與所述訓練數據的標注結果的誤差最小時,獲得訓練好的聲母、韻母和聲調對應的深層神經網絡模型,所述訓練數據的標注結果包括所述訓練數據的正確的聲母、韻母和聲調的信息。
5.一種基于深度神經網絡的多音字讀音的判別裝置,其特征在于,包括:
編碼模塊,用于對待識別文本中的每個漢字進行量化編碼;
生成模塊,用于根據所述漢字的量化編碼、所述漢字的分詞詞性和分詞邊界,以及所述漢字的多音字標識生成所述漢字的特征向量;以及根據所述漢字的特征向量,結合雙向的長短時記憶模型獲取的所述漢字的雙方向的上下文信息,生成所述漢字的輸入特征,所述上下文信息包括所述漢字所屬的句子成分、所述漢字在句子中的位置和所述漢字的上下文文本中各分詞的分詞屬性;
獲得模塊,用于將所述生成模塊生成的所述漢字的輸入特征分別輸入聲母、韻母和聲調對應的深層神經網絡模型,分別獲得所述漢字的讀音的聲母對應漢語拼音中每個聲母的第一概率、所述漢字的讀音的韻母對應漢語拼音中每個韻母的第二概率和所述漢字的讀音的聲調對應漢語拼音中每個聲調的第三概率;
確定模塊,用于根據所述第一概率、所述第二概率和所述第三概率計算所述漢字的讀音對應的聲母、韻母和聲調的各種組合的概率,以概率最高的組合作為所述漢字的讀音。
6.根據權利要求5所述的裝置,其特征在于,
所述編碼模塊,具體用于利用語料庫預訓練得到的單字的字向量表示,對待識別文本中的每個漢字進行量化編碼。
7.根據權利要求5所述的裝置,其特征在于,所述雙向的長短時記憶模型獲取的所述漢字的雙方向的上下文信息包括:所述漢字的從前至后和從后至前兩個方向的上下文信息,所述上下文信息包括所述漢字所屬的句子成分、所述漢字在句子中的位置和所述漢字的上下文文本中各分詞的分詞屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710876713.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生成信用金的方法和系統
- 下一篇:聯名賬戶處理方法、系統及服務器





