[發明專利]適用于多音字的音素預測方法、裝置、設備及存儲介質有效
| 申請號: | 202110342957.4 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN112800748B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 蘇雪琦;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/284;G06F40/30;G06N3/08 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 適用于 多音字 音素 預測 方法 裝置 設備 存儲 介質 | ||
本申請涉及人工智能技術領域,揭示了一種適用于多音字的音素預測方法、裝置、設備及存儲介質,其中方法包括:對待預測的文本數據進行句子結構分析、文本正則化處理、分詞處理和詞性預測得到預處理后的文本數據,然后輸入音素預測模型進行音素預測,音素預測模型是基于Bert模型、含有多音字的多個訓練樣本和MLM模型訓練方法進行訓練得到的模型,MLM模型訓練方法包括:多音字掩碼的訓練方法、多音字隨機拼音替代的訓練方法、不掩碼和不遮蔽的訓練方法;獲取音素預測模型輸出的目標音素預測結果。提高了音素預測的覆蓋面、智能度,降低了維護成本。
技術領域
本申請涉及到人工智能技術領域,特別是涉及到一種適用于多音字的音素預測方法、裝置、設備及存儲介質。
背景技術
字形轉音素(G2P,Grapheme-to-Phoneme)是中文TTS(從文本到語音)系統的文本前端的關鍵環節之一,作用是將作為象形文字的中文轉換為聲學模型能識別的音素。因為漢字中存在大量一詞多音的情況,在字形轉音素環節中常用詞表命中、正則表達式匹配等基于規則的方法解決針對多音字準確賦予正確的音素的問題。但是基于規則的方法存在如下問題:(1)覆蓋面不足、智能度缺乏,往往只能通過手動新增詞表或規則來解決,并且難以避免業務響應時差的問題;(2)維護成本高,規則難以全面覆蓋在特定語境中的語義讀音。
發明內容
本申請的主要目的為提供一種適用于多音字的音素預測方法、裝置、設備及存儲介質,旨在解決現有技術基于規則的方法解決針對多音字準確賦予正確的音素的問題,存在覆蓋面不足、智能度缺乏,維護成本高的技術問題。
為了實現上述發明目的,本申請提出一種適用于多音字的音素預測方法,所述方法包括:
獲取待預測的文本數據;
對所述待預測的文本數據進行句子結構分析、文本正則化處理、分詞處理和詞性預測,得到預處理后的文本數據;
將所述預處理后的文本數據輸入音素預測模型進行音素預測,其中,所述音素預測模型是基于Bert模型、含有多音字的多個訓練樣本和MLM模型訓練方法進行訓練得到的模型,所述MLM模型訓練方法包括:多音字掩碼的訓練方法、多音字隨機拼音替代的訓練方法、不掩碼和不遮蔽的訓練方法;
獲取所述音素預測模型輸出的目標音素預測結果。
進一步的,所述將所述預處理后的文本數據輸入音素預測模型進行音素預測的步驟之前,還包括:
獲取所述多個訓練樣本,其中,所述多個訓練樣本中的每個訓練樣本包括:文本樣本數據和音素標定數據,所述文本樣本數據中包括至少一個多音字;
采用預設的劃分規則,對所述多個訓練樣本進行劃分,得到第一訓練樣本集合、第二訓練樣本集合和第三訓練樣本集合;
采用所述第一訓練樣本集合,對初始模型進行多音字掩碼訓練,訓練結束得到多音字掩碼訓練后的初始模型,其中,所述初始模型是基于所述Bert模型得到的模型;
采用所述第二訓練樣本集合,對所述多音字掩碼訓練后的初始模型進行多音字隨機拼音替代訓練,訓練結束得到多音字隨機拼音替代訓練后的初始模型;
采用所述第三訓練樣本集合,對所述多音字隨機拼音替代訓練后的初始模型進行訓練,訓練結束得到所述音素預測模型。
進一步的,所述獲取所述多個訓練樣本的步驟,包括:
獲取多個待處理的文本數據,所述多個待處理的文本數據中每個待處理的文本數據包括至少一個多音字;
分別對所述多個待處理的文本數據中的每個待處理的文本數據進行句子結構分析、文本正則化處理、分詞處理和詞性預測,得到所述多個待處理的文本數據各自對應的所述文本樣本數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110342957.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種利用層級結構的新站點流量預測方法
- 下一篇:多功能的嬰兒車





