[發明專利]音頻識別方法、裝置、終端及存儲介質在審
| 申請號: | 202010615325.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111768782A | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 陳土亮;何越 | 申請(專利權)人: | 廣州酷狗計算機科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/02;G10L17/22;G10L25/51 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 郭翱杰 |
| 地址: | 510660 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 識別 方法 裝置 終端 存儲 介質 | ||
本申請提供了一種音頻識別方法、裝置、終端及存儲介質,屬于計算機技術領域。所述方法包括:當接收到音頻識別指令時,啟動屏幕錄制;獲得在屏幕錄制的過程中所述終端的音頻轉換單元接收到的音頻數據;對所述音頻數據進行識別,得到所述音頻數據對應的音頻信息。本申請基于屏幕錄制過程中的數據調用權限,從本地獲取需要識別的音頻數據,進行音頻識別,實現了終端未處于音頻外放模式時對本地播放的音頻的識別,擴展了音頻識別的使用場景。
技術領域
本申請涉及計算機技術領域,特別涉及一種音頻識別方法、裝置、終端及存儲介質。
背景技術
音頻識別為用戶提供了一種快速便捷的音樂搜索方式。用戶在聽到自己喜歡的音樂時,可以應用終端的音頻識別功能,來快速獲知音樂的相關信息。當前,終端只能對外部環境中采集到的音頻,進行識別,將識別出的音頻相關信息展示給用戶。
當用戶想要了解終端正在播放的音頻的相關信息時,只有將終端調整為音頻外放模式,才能使終端在外部環境中采集到正在播放的音頻,進行音頻識別。若終端通過耳機播放音頻,也即未處于音頻外放模式時,則無法在外部環境中采集到本地正在播放的音頻,進而也無法進行音頻識別。因此,亟需一種在終端未處于音頻外放模式時對本地播放的音頻進行識別的方法。
發明內容
本申請實施例提供了一種音頻識別方法、裝置、終端及存儲介質,能夠在終端未處于音頻外放模式時,實現對本地播放的音頻的識別。所述技術方案如下:
一方面,提供了一種音頻識別方法,所述方法包括:
當接收到音頻識別指令時,啟動屏幕錄制;
獲得在屏幕錄制的過程中所述終端的音頻轉換單元接收到的音頻數據;
對所述音頻數據進行識別,得到所述音頻數據對應的音頻信息。
在一種可能的實現方式中,所述當接收到音頻識別指令時,啟動屏幕錄制,包括:
當接收到音頻識別指令且音頻播放模式為耳機播放模式時,啟動屏幕錄制。
在另一種可能的實現方式中,所述獲得在屏幕錄制的過程中所述終端的音頻轉換單元接收到的音頻數據,包括:
獲得所述終端的音頻擴展程序接收到的音頻數據;其中,所述音頻擴展程序在屏幕錄制的過程中具有對所述終端的音頻轉換單元接收到的音頻數據的數據調用權限。
在另一種可能的實現方式中,所述當接收到音頻識別指令時,啟動屏幕錄制之前,所述方法還包括:
顯示目標客戶端的音頻識別界面,所述目標客戶端為具有音頻識別功能的客戶端,所述音頻識別界面包括音頻識別控件,所述音頻識別控件用于指示基于屏幕錄制進行音頻識別;
響應于對所述音頻識別控件的交互操作,觸發音頻識別指令。
在另一種可能的實現方式中,所述當接收到音頻識別指令時,啟動屏幕錄制之前,所述方法還包括:
顯示系統功能界面,所述系統功能界面包括屏幕錄制控件;
響應于對所述屏幕錄制控件的交互操作,顯示錄制選項窗口,所述錄制選項窗口包括音頻擴展選項,所述音頻擴展選項用于指示基于屏幕錄制進行音頻識別;
響應于對所述音頻擴展選項的交互操作,觸發音頻識別指令。
在另一種可能的實現方式中,所述對所述音頻數據進行識別,得到所述音頻數據對應的音頻信息,包括:
生成所述音頻數據的聲紋數據;
向服務器發送攜帶所述聲紋數據的音頻識別請求;
接收服務器基于所述聲紋數據返回的所述音頻數據對應的音頻信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司,未經廣州酷狗計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010615325.6/2.html,轉載請聲明來源鉆瓜專利網。





