[發明專利]語音交互處理方法、裝置和電子設備在審
| 申請號: | 202010187179.1 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111354360A | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 何桂 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/08 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張娜;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 交互 處理 方法 裝置 電子設備 | ||
本申請公開了一種語音交互處理方法、裝置和電子設備,涉及語音技術領域。具體實現方案為:通過接收語音數據,并將該語音數據和當前處于前臺運行的目標應用程序對應的語音庫進行匹配,其中,該語音庫中包括多個與目標應用程序關聯的控制命令;若匹配成功,則控制電子設備啟動免喚醒功能,并執行與語音數據對應的操作。可以看出,本申請實施例中將接收到的語音數據和當前處于前臺運行的目標應用程序對應的語音庫進行匹配,若匹配成功,則該電子設備將不需要喚醒,直接執行與語音數據對應的操作,這樣,電子設備可以及時為用戶提供相應的服務,從而可以提高用戶的體驗。
技術領域
本申請涉及數據技術領域,尤其涉及語音技術領域。
背景技術
隨著人工智能技術的不斷發展,用戶在日常生活中越來越多的通過語音交互方式從電子設備獲得服務。
目前,大多數電子設備都需要用戶對其進行喚醒,在喚醒電子設備之后,用戶才能正常發起語音查詢(query)請求,即用戶與電子設備進行對話。這種用戶每次在發起語音查詢請求之前,都必須喚醒電子設備的情況,造成用戶體驗感較差。基于此,現有技術中還提供一種免喚醒的方案:電子設備針對預設的一些免喚醒詞采集大量的語料數據,并根據這些語料數據對初始喚醒模型進行不斷訓練,得到喚醒模型。這樣,電子設備在獲取到語音數據時,將獲取的語音數據與訓練得到的喚醒模型進行匹配,在匹配到預設的免喚醒詞時,則喚醒電子設備。
然而,上述的免喚醒方案中,由于預設的免喚醒詞的數量有限,可能會造成在語音數據中不包括預設的免喚醒詞時,電子設備無法及時提供相應的服務,造成用戶體驗不好。
發明內容
本申請實施例提供一種語音交互處理方法、裝置和電子設備,可以使得電子設備能夠及時為用戶提供相應的服務,由此可以提高用戶的體驗。
第一方面,本申請實施例提供一種語音交互處理方法,該語音交互處理方法可以包括:
接收語音數據;
將所述語音數據和當前處于前臺運行的目標應用程序對應的語音庫進行匹配,所述語音庫中包括多個與所述目標應用程序關聯的控制命令;
若匹配成功,則控制電子設備啟動免喚醒功能,并執行與所述語音數據對應的操作。
可以看出,與現有技術不同的是,本申請實施例在將接收到的語音數據和當前處于前臺運行的目標應用程序對應的語音庫匹配成功之后,不需要喚醒電子設備,而是直接對語音數據進行識別,以執行與語音數據對應的操作,這樣,不僅可以簡化用戶的操作,而且電子設備可以及時為用戶提供相應的服務,由此可以提高用戶的體驗。
第二方面,本申請實施例還提供一種語音交互處理裝置,該裝置包括:
接收模塊,用于接收語音數據;
處理模塊,用于將所述語音數據和當前處于前臺運行的目標應用程序對應的語音庫進行匹配,所述語音庫中包括多個與所述目標應用程序關聯的控制命令;
所述處理模塊,還用于在匹配成功時,控制所述語音交互處理裝置啟動免喚醒功能,并執行與所述語音數據對應的操作。
第三方面,本申請實施例還提供一種電子設備,該電子設備可以包括:
至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述第一方面任一種可能的實現方式中所述的語音交互處理方法。
第四方面,本申請實施例還提供一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行上述第一方面任一種可能的實現方式中所述的語音交互處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010187179.1/2.html,轉載請聲明來源鉆瓜專利網。





