[發(fā)明專利]動態(tài)語音辨識方法及其裝置在審
| 申請?zhí)枺?/td> | 201911242880.2 | 申請日: | 2019-12-06 |
| 公開(公告)號: | CN112927685A | 公開(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計)人: | 王美華;陳慶隆 | 申請(專利權(quán))人: | 瑞昱半導(dǎo)體股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/08;G10L25/21 |
| 代理公司: | 隆天知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 石海霞;章侃銥 |
| 地址: | 中國臺*** | 國省代碼: | 臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 動態(tài) 語音 辨識 方法 及其 裝置 | ||
1.一種動態(tài)語音辨識方法,包含:
執(zhí)行一第一階段:
利用一數(shù)字麥克風(fēng)檢測一聲音資料并儲存在一第一存儲器;
于該聲音資料中檢測到人聲而產(chǎn)生一人聲檢測信號;及
通過一第一處理電路根據(jù)一總有效資料量、該數(shù)字麥克風(fēng)的傳輸位元元速率及一辨識間隔時間,選擇性決定執(zhí)行一第二階段或一第三階段;
執(zhí)行該第二階段:
該第一處理電路輸出一第一指令至一第二處理電路,該第二處理電路根據(jù)該第一指令使一存儲器存取電路轉(zhuǎn)移該聲音資料至一第二存儲器并儲存為一語音資料;以及
執(zhí)行該第三階段:
該第一處理電路輸出一第二指令至該第二處理電路,該第二處理電路根據(jù)該第二指令使該存儲器存取電路轉(zhuǎn)移該聲音資料至該第二存儲器并儲存為該語音資料,且該第二處理電路確認(rèn)該第二存儲器中的該語音資料是否匹配一預(yù)設(shè)語音指令。
2.如權(quán)利要求1所述的動態(tài)語音辨識方法,其中該總有效資料量小于該數(shù)字麥克風(fēng)的該傳輸位元元速率與該辨識間隔時間的乘積時,該第一處理電路決定執(zhí)行該第二階段;以及該總有效資料量大于等于該數(shù)字麥克風(fēng)的該傳輸位元元速率與該辨識間隔時間的乘積時,該第一處理電路決定執(zhí)行該第三階段,其中該總有效資料量系為該第一存儲器的有效資料量及該第二存儲器的有效資料量的總和。
3.如權(quán)利要求2所述的動態(tài)語音辨識方法,其中該第一處理電路接收到該人聲檢測信號時,該第一處理電路于該辨識間隔時間后輸出該第一指令或該第二指令。
4.如權(quán)利要求3所述的動態(tài)語音辨識方法,其中該辨識間隔時間是由一預(yù)算關(guān)系值決定,該預(yù)算關(guān)系值小于等于目標(biāo)平均功率消耗*前一周期時間*1/3時,該辨識間隔時間為2秒;該預(yù)算關(guān)系值大于該目標(biāo)平均功率消耗*該前一周期時間*1/3且小于等于該目標(biāo)平均功率消耗*該前一周期時間*2/3時,該辨識間隔時間系為1.5秒;以及該預(yù)算關(guān)系值大于該目標(biāo)平均功率消耗*該前一周期時間*2/3時,該辨識間隔時間系為1秒。
5.如權(quán)利要求4所述的動態(tài)語音辨識方法,其中該預(yù)算關(guān)系值為該目標(biāo)平均功率消耗*該前一周期時間-(該第一階段的第一平均功率消耗*該第一階段的第一時間+該第二階段的第二平均功率消耗*該第二階段的第二時間+該第三階段的第三平均功率消耗*該第三階段的第三時間),其中該前一周期時間等于該第一時間、該第二時間及該第三時間的總和。
6.如權(quán)利要求5所述的動態(tài)語音辨識方法,其中該第三平均功率消耗大于該第二平均功率消耗,且該第二平均功率消耗大于該第一平均功率消耗。
7.如權(quán)利要求1所述的動態(tài)語音辨識方法,其中在產(chǎn)生該人聲檢測信號的步驟后,更包括:判斷該第一存儲器是否已存滿該聲音資料,并在存滿該聲音資料時繼續(xù)進(jìn)行下一步驟。
8.如權(quán)利要求1所述的動態(tài)語音辨識方法,其中在執(zhí)行該第一階段中,在選擇性決定執(zhí)行該第二階段或該第三階段的步驟后,更包括:該第一處理電路喚醒該第二處理電路。
9.如權(quán)利要求1所述的動態(tài)語音辨識方法,其中在該第一處理電路輸出該第一指令或該第二指令時,該第一處理電路喚醒該第二處理電路。
10.一種動態(tài)語音辨識裝置,包含:
一數(shù)字麥克風(fēng),用以檢測一聲音資料;
一第一存儲器,電性連接該數(shù)字麥克風(fēng),用以儲存該聲音資料;
一語音活動檢測電路,電性連接該數(shù)字麥克風(fēng),用以檢測該聲音資料并產(chǎn)生一人聲檢測信號;
一存儲器存取電路,電性連接該第一存儲器,該存儲器存取電路轉(zhuǎn)移該聲音資料至一第二存儲器,以儲存為一語音資料;
一第一處理電路,電性連接該語音活動檢測電路;以及
一第二處理電路,電性連接該第一處理電路、該第二存儲器及該存儲器存取電路;
其中,該動態(tài)語音辨識裝置用以執(zhí)行下列步驟:
執(zhí)行一第一階段:
利用該數(shù)字麥克風(fēng)檢測該聲音資料并儲存在該第一存儲器;
該語音活動檢測電路于該聲音資料中檢測到人聲而產(chǎn)生該人聲檢測信號;及
通過該第一處理電路根據(jù)一總有效資料量、該數(shù)字麥克風(fēng)的傳輸位元元速率及一辨識間隔時間,選擇性決定執(zhí)行一第二階段或一第三階段;
執(zhí)行該第二階段:
該第一處理電路輸出一第一指令至該第二處理電路,該第二處理電路根據(jù)該第一指令使該存儲器存取電路轉(zhuǎn)移該聲音資料至該第二存儲器并儲存為該語音資料;以及
執(zhí)行該第三階段:
該第一處理電路輸出一第二指令至該第二處理電路,該第二處理電路根據(jù)該第二指令使該存儲器存取電路轉(zhuǎn)移該聲音資料至該第二存儲器并儲存為該語音資料,且該第二處理電路確認(rèn)該第二存儲器中的該語音資料是否匹配一預(yù)設(shè)語音指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瑞昱半導(dǎo)體股份有限公司,未經(jīng)瑞昱半導(dǎo)體股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911242880.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





