[發(fā)明專利]語音喚醒方法及相關(guān)裝置、電子設(shè)備、存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202211269791.9 | 申請日: | 2022-10-14 |
| 公開(公告)號: | CN115798468A | 公開(公告)日: | 2023-03-14 |
| 發(fā)明(設(shè)計)人: | 肖建輝 | 申請(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/22 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 柳芳 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 喚醒 方法 相關(guān) 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種語音喚醒方法及相關(guān)裝置、電子設(shè)備、存儲介質(zhì),其中,語音喚醒方法包括:檢測用戶語音的喚醒置信度,并依次分析喚醒置信度分別與第一喚醒閾值、第二喚醒閾值之間的大小關(guān)系,且第一喚醒閾值小于第二喚醒閾值;響應(yīng)于喚醒置信度不小于第二喚醒閾值,開啟語音交互;響應(yīng)于喚醒置信度不小于第一喚醒閾值且小于第二喚醒閾值,基于從用戶語音提取到的第一聲紋特征和語音交互系統(tǒng)已經(jīng)存儲的若干第二聲紋特征,確定是否開啟語音交互。上述方案,能夠提升喚醒響應(yīng)速度,同時提升喚醒準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請涉及人工智能技術(shù)領(lǐng)域,特別是涉及一種語音喚醒方法及相關(guān)裝置、電子設(shè)備、存儲介質(zhì)。
背景技術(shù)
隨著人工智能技術(shù)飛速發(fā)展,智能語音技術(shù)已經(jīng)全面普及,基于聲紋的喚醒方案也廣泛應(yīng)用于智能家居、移動設(shè)備、車載領(lǐng)域等各類語音產(chǎn)品。
當(dāng)前,隨著智能語音技術(shù)的全面普及,語音喚醒的響應(yīng)速度和語音喚醒的準(zhǔn)確性也愈發(fā)重要。有鑒于此,如何提升喚醒響應(yīng)速度,同時提升喚醒準(zhǔn)確性,成為亟待解決的問題。
發(fā)明內(nèi)容
本申請主要解決的技術(shù)問題是提供一種語音喚醒方法及相關(guān)裝置、電子設(shè)備、存儲介質(zhì),能夠提升喚醒響應(yīng)速度,同時提升喚醒準(zhǔn)確性。
為了解決上述技術(shù)問題,本申請第一方面提供了一種語音喚醒方法,包括:檢測用戶語音的喚醒置信度,并依次分析喚醒置信度分別與第一喚醒閾值、第二喚醒閾值之間的大小關(guān)系,且第一喚醒閾值小于第二喚醒閾值;響應(yīng)于喚醒置信度不小于第二喚醒閾值,開啟語音交互;響應(yīng)于喚醒置信度不小于第一喚醒閾值且小于第二喚醒閾值,基于從用戶語音提取到的第一聲紋特征和語音交互系統(tǒng)已經(jīng)存儲的若干第二聲紋特征,確定是否開啟語音交互。
為了解決上述技術(shù)問題,本申請第二方面提供了一種語音喚醒裝置,包括:置信檢測模塊、數(shù)值分析模塊、第一響應(yīng)模塊和第二響應(yīng)模塊;其中,置信檢測模塊用于檢測用戶語音的喚醒置信度;數(shù)值分析模塊用于依次分析喚醒置信度分別與第一喚醒閾值、第二喚醒閾值之間的大小關(guān)系;其中,第一喚醒閾值小于第二喚醒閾值;第一響應(yīng)模塊用于響應(yīng)于喚醒置信度不小于第二喚醒閾值,開啟語音交互;第二響應(yīng)模塊用于響應(yīng)于喚醒置信度不小于第一喚醒閾值且小于第二喚醒閾值,基于從用戶語音提取到的第一聲紋特征和語音交互系統(tǒng)已經(jīng)存儲的若干第二聲紋特征,確定是否開啟語音交互。
為了解決上述技術(shù)問題,本申請第三方面提供了一種電子設(shè)備,包括相互耦接的存儲器和處理器,存儲器中存儲有程序指令,處理器用于執(zhí)行程序指令以實現(xiàn)上述第一方面的語音喚醒方法。
為了解決上述技術(shù)問題,本申請第四方面提供了一種計算機(jī)可讀存儲介質(zhì),存儲有能夠被處理器運行的程序指令,程序指令用于實現(xiàn)上述第一方面的語音喚醒方法。
上述方案,檢測用戶語音的喚醒置信度,并依次分析喚醒置信度分別與第一喚醒閾值、第二喚醒閾值之間的大小關(guān)系,且第一喚醒閾值小于第二喚醒閾值;響應(yīng)于喚醒置信度不小于第二喚醒閾值,開啟語音交互;響應(yīng)于喚醒置信度不小于第一喚醒閾值且小于第二喚醒閾值,基于從用戶語音提取到的第一聲紋特征和語音交互系統(tǒng)已經(jīng)存儲的若干第二聲紋特征,確定是否開啟語音交互,一方面設(shè)置雙喚醒閾值,通過差異性地喚醒閾值,進(jìn)而確定是否開啟語音交互,有助于降低語音誤喚醒概率,另一方面在喚醒置信度不小于第一喚醒閾值且小于第二喚醒閾值,基于第一聲紋特征和第二聲紋特征,確定是否開啟語音交互,有助于提升喚醒準(zhǔn)確性,此外,在語音喚醒過程中,通過先進(jìn)行喚醒閾值判斷,再視情況進(jìn)行聲紋檢測,進(jìn)而確定是否開啟語音交互,能夠提升喚醒響應(yīng)速度,同時提升喚醒準(zhǔn)確性。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,而非限制本申請。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,這些附圖示出了符合本申請的實施例,并與說明書一起用于說明本申請的技術(shù)方案。
圖1是本申請語音喚醒方法一實施例的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211269791.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





