[發明專利]語音交互過程中的多音字播報方法及系統有效
| 申請號: | 201611199610.4 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN106710585B | 公開(公告)日: | 2019-11-08 |
| 發明(設計)人: | 王鳴 | 申請(專利權)人: | 云知聲(上海)智能科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08;G10L15/02;G10L15/06 |
| 代理公司: | 上海唯源專利代理有限公司 31229 | 代理人: | 曾耀先 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 播報 多音字 反饋信息 音素信息 語音交互 語音信息 注音 文本信息 先驗信息 音信息 準確率 存儲 釋放 | ||
1.一種語音交互過程中的多音字播報方法,包括步驟a.獲取語音信息;其特征在于,還包括如下步驟:
b.識別所述語音信息,通過識別得出所述語音信息對應的文本信息和音素信息;
c.執行所述文本信息的指令并形成相應的反饋信息;
d.對所述反饋信息進行注音:查找所述反饋信息中是否包括多音字,若查找到多音字,將反饋信息與所述文本信息進行比對,若比對成功,從所述音素信息中獲取發音并對反饋信息中的多音字進行注音;若比對不成功,則依據大量數據訓練模型的方法來對反饋信息中的多音字進行注音;
e.對所述反饋信息進行播報。
2.根據權利要求1所述的語音交互過程中的多音字播報方法,其特征在于:在所述步驟b中,還包括將所述文本信息和音素信息作為先驗信息進行存儲。
3.根據權利要求2所述的語音交互過程中的多音字播報方法,其特征在于:所述反饋信息播報結束后,釋放預先存儲的先驗信息。
4.根據權利要求1所述的語音交互過程中的多音字播報方法,其特征在于:在所述步驟c中,所述反饋信息是文本形式的信息。
5.根據權利要求1所述的語音交互過程中的多音字播報方法,其特征在于:在所述步驟d中,還包括對所述反饋信息中的單音字進行注音。
6.根據權利要求1所述的語音交互過程中的多音字播報方法,其特征在于:在所述步驟d中,若在所述反饋信息中未查找到多音字,則直接對反饋信息進行注音。
7.一種實施如權利要求1至6中任一項所述的語音交互過程中的多音字播報方法的系統,其特征在于,所述系統包括錄音模塊、語音識別模塊、處理及控制模塊、語音合成模塊以及語音播報模塊:
所述錄音模塊,與所述語音識別模塊以及所述處理及控制模塊連接,用于獲取語音信息并將所述語音信息傳送給所述語音識別模塊;
所述語音識別模塊,與所述處理及控制模塊連接,用于識別所述語音信息并得出與所述語音信息對應的文本信息和音素信息,將所述文本信息和音素信息傳送給所述處理及控制模塊;
所述處理及控制模塊,與所述語音合成模塊及語音播報模塊連接,用于執行所述文本信息的指令并形成相應的反饋信息,將所述反饋信息傳送給所述語音合成模塊;
所述語音合成模塊,與所述語音播報模塊連接,用于查找所述反饋信息中是否包含多音字并對所述反饋信息進行注音,并將已注音的反饋信息傳送給所述語音播報模塊;
所述語音播報模塊,用于播報所述已注音的反饋信息。
8.根據權利要求7所述的語音交互過程中的多音字播報系統,其特征在于,所述反饋信息是文本形式的信息。
9.根據權利要求7所述的語音交互過程中的多音字播報系統,其特征在于,所述系統還包括臨時存儲模塊,所述臨時存儲模塊與所述處理及控制模塊連接,所述語音識別模塊通過所述處理及控制模塊將所述文本信息和音素信息作為先驗信息存儲到所述臨時存儲模塊中。
10.根據權利要求9所述的語音交互過程中的多音字播報系統,其特征在于,所述處理及控制模塊將所述先驗信息從所述臨時存儲模塊中釋放。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲(上海)智能科技有限公司,未經云知聲(上海)智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611199610.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全天時霧霾圖像清晰化恢復方法
- 下一篇:基于人工智能的語音處理方法及裝置





