[發(fā)明專利]動態(tài)語音辨識方法及其裝置在審
| 申請?zhí)枺?/td> | 201911242880.2 | 申請日: | 2019-12-06 |
| 公開(公告)號: | CN112927685A | 公開(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計(jì))人: | 王美華;陳慶隆 | 申請(專利權(quán))人: | 瑞昱半導(dǎo)體股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/08;G10L25/21 |
| 代理公司: | 隆天知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 石海霞;章侃銥 |
| 地址: | 中國臺*** | 國省代碼: | 臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 動態(tài) 語音 辨識 方法 及其 裝置 | ||
本發(fā)明提供一種動態(tài)語音辨識方法及裝置。動態(tài)語音辨識方法包含執(zhí)行一第一階段:利用數(shù)字麥克風(fēng)檢測聲音資料并儲存在第一存儲器、于聲音資料中檢測到人聲而產(chǎn)生人聲檢測信號,及通過第一處理電路根據(jù)總有效資料量、數(shù)字麥克風(fēng)的傳輸位元元速率及辨識間隔時(shí)間,選擇性決定執(zhí)行第二階段或第三階段。執(zhí)行第二階段,第一處理電路輸出第一指令至第二處理電路,第二處理電路根據(jù)第一指令令存儲器存取電路轉(zhuǎn)移聲音資料至第二存儲器并儲存為語音資料。執(zhí)行第三階段,第一處理電路輸出第二指令至第二處理電路,第二處理電路根據(jù)第二指令令存儲器存取電路轉(zhuǎn)移聲音資料至第二存儲器并儲存為語音資料,且第二處理電路確認(rèn)語音資料是否匹配預(yù)設(shè)語音指令。
技術(shù)領(lǐng)域
本發(fā)明系有關(guān)一種語音檢測辨識技術(shù),特別是關(guān)于一種動態(tài)語音辨識方法及其裝置。
背景技術(shù)
在現(xiàn)有電子設(shè)備中,語音助理(voice assistant)技術(shù)廣泛應(yīng)用于各領(lǐng)域中,且支援語音喚醒功能。在語音助理處于待機(jī)模式(standby mode)下,仍然需要聽令于熱詞并在有熱詞出現(xiàn)時(shí)給予對應(yīng)回應(yīng),因此語音助理必須定期喚醒,語音助理的處理系統(tǒng)會在待機(jī)模式下啟動,以利用語音活動檢測電路檢測是否有人聲,并在有人聲出現(xiàn)時(shí)才進(jìn)一步進(jìn)入語音辨識,以確認(rèn)人聲中是否有熱詞(hot words)存在,進(jìn)而據(jù)此判斷是否執(zhí)行電子設(shè)備的系統(tǒng)開機(jī)或執(zhí)行對應(yīng)操作。
然而,等頻率的定期喚醒語音助理進(jìn)行檢測,其靈敏度較差。同時(shí),語音助理的處理系統(tǒng)也需滿足低功率的操作,以符合能源要求的相關(guān)規(guī)范。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出一種動態(tài)語音辨識方法,包含執(zhí)行一第一階段:利用數(shù)字麥克風(fēng)檢測聲音資料并儲存在第一存儲器;于聲音資料中檢測到人聲而產(chǎn)生人聲檢測信號;及通過第一處理電路根據(jù)總有效資料量、數(shù)字麥克風(fēng)的傳輸位元元速率及辨識間隔時(shí)間,選擇性決定執(zhí)行第二階段或第三階段。執(zhí)行第二階段,第一處理電路輸出第一指令至第二處理電路,第二處理電路根據(jù)第一指令使存儲器存取電路轉(zhuǎn)移聲音資料至第二存儲器并儲存為語音資料。執(zhí)行第三階段,第一處理電路輸出第二指令,第二處理電路根據(jù)第二指令使存儲器存取電路轉(zhuǎn)移聲音資料至第二存儲器并儲存為語音資料,且第二處理電路確認(rèn)第二存儲器中的語音資料是否匹配一預(yù)設(shè)語音指令。
本發(fā)明另提出一種動態(tài)語音辨識裝置,包含數(shù)字麥克風(fēng)、第一存儲器、語音活動檢測電路、存儲器存取電路、第二存儲器、第一處理電路及第二處理電路。數(shù)字麥克風(fēng)用以檢測一聲音資料。第一存儲器電性連接數(shù)字麥克風(fēng),用以儲存聲音資料。語音活動檢測電路電性連接數(shù)字麥克風(fēng),用以檢測聲音資料并產(chǎn)生一人聲檢測信號。存儲器存取電路電性連接第一存儲器,用以根據(jù)第一指令轉(zhuǎn)移聲音資料至第二存儲器,以儲存為語音資料。第一處理電路電性連接語音活動檢測電路。第二處理電路電性連接第一處理電路、第二存儲器及存儲器存取電路。其中,此動態(tài)語音辨識裝置用以執(zhí)行前述的動態(tài)語音辨識方法。
依據(jù)一些實(shí)施例,第一處理電路接收到人聲檢測信號時(shí),第一處理電路于辨識間隔時(shí)間后輸出第一指令或第二指令。
依據(jù)一些實(shí)施例,辨識間隔時(shí)間是由一預(yù)算關(guān)系值決定,預(yù)算關(guān)系值小于等于目標(biāo)平均功率消耗*前一周期時(shí)間*1/3時(shí),辨識間隔時(shí)間系為2秒;預(yù)算關(guān)系值大于目標(biāo)平均功率消耗*前一周期時(shí)間*1/3且小于等于目標(biāo)平均功率消耗*前一周期時(shí)間*2/3時(shí),辨識間隔時(shí)間系為1.5秒;以及預(yù)算關(guān)系值大于目標(biāo)平均功率消耗*前一周期時(shí)間*2/3時(shí),辨識間隔時(shí)間系為1秒。
依據(jù)一些實(shí)施例,預(yù)算關(guān)系值系為目標(biāo)平均功率消耗*前一周期時(shí)間-(第一階段的第一平均功率消耗*第一階段的第一時(shí)間+第二階段的第二平均功率消耗*第二階段的第二時(shí)間+第三階段的第三平均功率消耗*第三階段的第三時(shí)間),其中前一周期時(shí)間等于第一時(shí)間、第二時(shí)間及第三時(shí)間的總和。
依據(jù)一些實(shí)施例,如第三平均功率消耗大于第二平均功率消耗,且第二平均功率消耗大于第一平均功率消耗。
依據(jù)一些實(shí)施例,在產(chǎn)生人聲檢測信號的后,該第一處理電路判斷第一存儲器是否已存滿聲音資料,并在存滿聲音資料時(shí)繼續(xù)進(jìn)行下一步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瑞昱半導(dǎo)體股份有限公司,未經(jīng)瑞昱半導(dǎo)體股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911242880.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 動態(tài)矢量譯碼方法和動態(tài)矢量譯碼裝置
- 動態(tài)口令的顯示方法及動態(tài)令牌
- 動態(tài)庫管理方法和裝置
- 動態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動態(tài)口令生成方法、動態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動態(tài)模糊控制系統(tǒng)
- 一種基于動態(tài)信號的POS機(jī)和安全保護(hù)方法
- 圖像動態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動態(tài)聚合碼的系統(tǒng)
- 基于動態(tài)口令的身份認(rèn)證方法、裝置和動態(tài)令牌





