[發明專利]用于醫療場景的語音喚醒方法及系統在審
| 申請號: | 202111528745.1 | 申請日: | 2021-12-14 |
| 公開(公告)號: | CN114187909A | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 宋澤;甘津瑞;王冬冬;練勇 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/02;G06F40/232 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;侯曉艷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 醫療 場景 語音 喚醒 方法 系統 | ||
1.一種用于醫療場景的語音喚醒方法,包括:
將在所述醫療場景采集的音頻分別輸入至語音識別引擎和語音喚醒引擎進行多線程處理;
利用所述語音喚醒引擎確定的喚醒引擎狀態,對所述語音識別引擎確定語音識別結果進行標記,用于識別所述音頻中同聲母和/或同韻母連讀發音不清晰的喚醒詞;
若檢測到所述語音識別結果包含喚醒詞且所述喚醒引擎狀態為喚醒時,對所述音頻進行喚醒反饋。
2.根據權利要求1所述的方法,其中,所述利用所述語音喚醒引擎確定的喚醒引擎狀態包括:
通過所述語音喚醒引擎輸出所述音頻的喚醒后驗概率;
當所述喚醒后驗概率超過預設閾值時,將喚醒引擎狀態設置為喚醒,當所述喚醒后驗概率沒有超過所述預設閾值時,將喚醒引擎狀態設置為非喚醒,用于識別所述音頻中包含疊詞的喚醒詞。
3.根據權利要求1所述的方法,其中,所述語音識別引擎和所述語音喚醒引擎是離線的。
4.根據權利要求3所述的方法,其中,所述利用所述語音識別引擎確定語音識別結果包括:
對所述音頻進行語音端點檢測,若檢測到語音信號,對所述音頻中帶有語音信號的音頻段進行語音識別處理,若沒有檢測到語音信號,則停止語音識別。
5.一種用于醫療場景的語音喚醒系統,包括:
音頻采集程序模塊,用于將在所述醫療場景采集的音頻分別輸入至語音識別引擎和語音喚醒引擎進行多線程處理;
引擎管理程序模塊,用于利用所述語音喚醒引擎確定的喚醒引擎狀態,對所述語音識別引擎確定語音識別結果進行標記,用于識別所述音頻中同聲母和/或同韻母連讀發音不清晰的喚醒詞;
喚醒程序模塊,用于若檢測到所述語音識別結果包含喚醒詞且所述喚醒引擎狀態為喚醒時,對所述音頻進行喚醒反饋。
6.根據權利要求5所述的系統,其中,所述引擎管理程序模塊用于:
通過所述語音喚醒引擎輸出所述音頻的喚醒后驗概率;
當所述喚醒后驗概率超過預設閾值時,將喚醒引擎狀態設置為喚醒,當所述喚醒后驗概率沒有超過所述預設閾值時,將喚醒引擎狀態設置為非喚醒,用于識別所述音頻中包含疊詞的喚醒詞。
7.根據權利要求5所述的系統,其中,所述語音識別引擎和所述語音喚醒引擎是離線的。
8.根據權利要求7所述的系統,其中,所述引擎管理程序模塊用于:
對所述音頻進行語音端點檢測,若檢測到語音信號,對所述音頻中帶有語音信號的音頻段進行語音識別處理,若沒有檢測到語音信號,則停止語音識別。
9.一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-4中任一項所述方法的步驟。
10.一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1-4中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111528745.1/1.html,轉載請聲明來源鉆瓜專利網。





