技術領域
本發明涉及語音處理技術領域,尤其涉及一種語音喚醒方法及裝置。
背景技術
語音識別技術在近些年取得了顯著的進步,該技術已進入工業、家電、智 能家居等各個領域。語音喚醒即是語音識別技術的一種形式,其不直接接觸硬 件設備,通過語音即可將設備喚醒運行。一般情況下,大部分設備都是靠物理 按鍵實現設備的喚醒或者運行。然而,這對于用戶體驗來說并不好。語音作為 人們最自然的交流方式,通過語音喚醒這種非接觸式的方式啟動設備無疑是更 友好的。
發明內容
本發明實施例提供一種語音喚醒方法及裝置,用于提高利用語音喚醒終端 設備的準確度。
一種語音喚醒方法,包括以下步驟:
當終端設備接收到用戶輸入的包含預設喚醒詞的第一語音數據時,對所述 第一語音數據和預設語言模型進行匹配,獲得所述第一語音數據的置信度;
判斷所述置信度是否小于預設置信度閾值;
當所述置信度小于所述預設置信度閾值時,執行預設操作;
當所述置信度大于或等于所述預設置信度閾值時,喚醒所述終端設備的語 音控制功能。
本發明實施例的一些有益效果可以包括:
上述技術方案,通過確定包含預設喚醒詞的第一語音數據的置信度,并在 該置信度小于預設置信度閾值時執行預設操作,同時在該置信度大于或等于預 設置信度閾值時喚醒終端設備的語音控制功能,使得用戶利用語音喚醒終端設 備失敗時,終端設備能夠通過執行預設操作來提高第一語音數據的置信度,從 而提高用戶利用語音喚醒終端設備的準確度以及用戶的體驗度。
在一個實施例中,所述執行預設操作之后,所述方法還包括:
輸出第一提示信息,所述第一提示信息用于提示所述用戶再次輸入所述第 一語音數據,直至接收到的所述第一語音數據的置信度大于或等于所述預設置 信度閾值。
該實施例中,能夠在執行預設操作之后提示用戶再次輸入語音數據,使得 用戶重新輸入的語音數據的置信度能夠達到預設置信度閾值,從而提高用戶利 用語音喚醒終端設備的準確度以及用戶的體驗度。
在一個實施例中,所述執行預設操作,包括:
判斷所述終端設備當前是否正輸出第二語音數據;
當所述終端設備當前正輸出所述第二語音數據時,調低所述第二語音數據 的音量值。
該實施例中,能夠在終端設備當前正輸出語音數據時調低該語音數據的音 量值,從而使得用戶輸入的語音數據的置信度能夠達到預設置信度閾值,提高 用戶利用語音喚醒終端設備的準確度以及用戶的體驗度。
在一個實施例中,所述執行預設操作,包括:
輸出第二提示信息,所述第二提示信息用于提示所述用戶提高所述第一語 音數據的音量值。
該實施例中,通過提示用戶提高輸入語音數據的音量值,使得用戶輸入的 語音數據的置信度能夠達到預設置信度閾值,提高了用戶利用語音喚醒終端設 備的準確度以及用戶的體驗度。
在一個實施例中,所述執行預設操作,包括:
降低所述預設置信度閾值。
該實施例中,通過降低預設置信度閾值,使得用戶輸入的語音數據的置信 度更容易達到預設置信度閾值,提高了用戶利用語音喚醒終端設備的準確度以 及用戶的體驗度。
一種語音喚醒裝置,包括:
匹配模塊,用于當終端設備接收到用戶輸入的包含預設喚醒詞的第一語音 數據時,對所述第一語音數據和預設語言模型進行匹配,獲得所述第一語音數 據的置信度;
判斷模塊,用于判斷所述置信度是否小于預設置信度閾值;
執行模塊,用于當所述置信度小于所述預設置信度閾值時,執行預設操作;
喚醒模塊,用于當所述置信度大于或等于所述預設置信度閾值時,喚醒所 述終端設備的語音控制功能。
在一個實施例中,所述裝置還包括:
輸出模塊,用于所述執行預設操作之后,輸出第一提示信息,所述第一提 示信息用于提示所述用戶再次輸入所述第一語音數據,直至接收到的所述第一 語音數據的置信度大于或等于所述預設置信度閾值。
在一個實施例中,所述執行模塊包括:
判斷子模塊,用于判斷所述終端設備當前是否正輸出第二語音數據;