[發明專利]一種音頻播放延遲AI修正方法和裝置在審
| 申請號: | 202011484031.0 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112735463A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 林東姝 | 申請(專利權)人: | 杭州小伴熊科技有限公司 |
| 主分類號: | G10L21/055 | 分類號: | G10L21/055;G10L25/30 |
| 代理公司: | 中國和平利用軍工技術協會專利中心 11215 | 代理人: | 劉光德 |
| 地址: | 310051 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 播放 延遲 ai 修正 方法 裝置 | ||
1.一種安卓移動端設備音頻播放延遲的AI修正方法,其特征在于,
控制音頻芯片在預定的時間間隔測量傳入的模擬音頻流信號;
將上述模擬音頻流信號轉換為數字音頻流信號后輸入緩沖區,其中緩沖區的大小根據總線類型設置;
監控緩沖區的數據量,將當前的音頻參數輸入基于機器學習的神經網絡,得到根據緩沖區中的數據量而產生的動態音頻參數;
根據所述動態音頻參數修正并播放音頻。
2.根據權利要求1所述的AI修正方法,其特征在于,其中所述音頻參數包括采樣率,聲道和比特率。
3.根據權利要求1所述的AI修正方法,其特征在于,其中在AudioFlinger層建立通道,如果用戶程序使用的是原生代碼并以原生的硬件采樣率和周期大小設置音頻緩沖隊列,此時不進行重采樣,也不對緩沖區大小進行修改;如果程序請求的緩沖采樣率不同于原生的采樣率,則需進行重采樣。
4.根據權利要求1所述的AI修正方法,其特征在于,其中AudioRecord不從AudioFlinger層請求新的緩沖。
5.根據權利要求1所述的AI修正方法,其特征在于,音頻流信號可通過總線從音頻芯片傳輸至GPU。
6.一種安卓移動端設備音頻播放延遲的AI修正裝置,其特征在于,該裝置包括:
音頻導入模塊101,用于控制音頻芯片在預定的時間間隔測量傳入的模擬音頻流信號,將上述模擬音頻流信號轉換為數字音頻流信號后輸入緩沖區,其中緩沖區的大小根據總線類型設置;
AI音頻分析模塊102,用于監控緩沖區的數據量,使用將當前的音頻參數輸入基于機器學習的神經網絡,得到基于根據緩沖區中的數據數量而產生的動態調整音頻參數;
音頻修正模塊103,用于根據所述動態音頻參數修正并播放音頻。
7.根據權利要求6所述的AI修正裝置,其特征在于,其中所述音頻參數包括采樣率,聲道和比特率;
所述AI音頻分析模塊102動態調整音頻參數位于音頻硬件抽象層(HAL)。
8.根據權利要求6所述的AI修正裝置,其特征在于,其中在AudioFlinger層建立通道,如果用戶程序使用的是原生代碼并以原生的硬件采樣率和周期大小設置音頻緩沖隊列,此時不進行重采樣,也不對緩沖區大小進行修改;如果程序請求的緩沖采樣率不同于原生的采樣率,則需進行重采樣。
9.根據權利要求8所述的AI修正裝置,其特征在于,其中AudioRecord不會從AudioFlinger層請求新的緩沖。
10.根據權利要求8所述的AI修正裝置,其特征在于,由AI音頻分析模塊102可將音頻流信號通過總線從音頻芯片傳輸至GPU。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州小伴熊科技有限公司,未經杭州小伴熊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011484031.0/1.html,轉載請聲明來源鉆瓜專利網。





