[發(fā)明專利]音箱音量自動調節(jié)的方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810808588.1 | 申請日: | 2018-07-23 |
| 公開(公告)號: | CN110753288B | 公開(公告)日: | 2021-08-17 |
| 發(fā)明(設計)人: | 趙鈞;聞劍峰;王昆 | 申請(專利權)人: | 中國電信股份有限公司 |
| 主分類號: | H04R1/20 | 分類號: | H04R1/20;H04R3/00 |
| 代理公司: | 中國貿(mào)促會專利商標事務所有限公司 11038 | 代理人: | 趙倩男 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音箱 音量 自動 調節(jié) 方法 系統(tǒng) | ||
本公開提供了一種音箱音量自動調節(jié)的方法和系統(tǒng),涉及人工智能領域。該方法包括:采集環(huán)境音;提取環(huán)境音的MFCC特征值以便生成語譜圖;將語譜圖輸入至聲音識別模型識別音頻類型,其中,音頻類型至少包括背景音;將語譜圖輸入至音量識別模型識別音量大小;若音頻類型中包含用戶話音,則根據(jù)用戶話音的音量大小反向調節(jié)音箱音量;若音頻類型中不包含用戶話音,則根據(jù)背景音的音量大小正向調節(jié)音箱音量。本公開能夠自適應的調節(jié)音箱音量,極大提升用戶收聽體驗。
技術領域
本公開涉及人工智能領域,尤其涉及一種音箱音量自動調節(jié)的方法和系統(tǒng)。
背景技術
隨著人工智能的興起,智能音箱也開始流行,目前智能音箱的音量通過人工設置,如觸控點擊、滑動或聲音控制,也可設置按時間定時調節(jié),如晚上22點自動調低音量,但不能根據(jù)環(huán)境和場景智能地調節(jié)音量,往往人在遠離音箱時因為聲音小收聽效果變差,或離得近講話時受音箱聲音大的影響。
發(fā)明內容
本公開要解決的一個技術問題是提供一種音箱音量自動調節(jié)的方法和系統(tǒng),能夠自適應的調節(jié)音箱音量。
根據(jù)本公開一方面,提出一種音箱音量自動調節(jié)的方法,包括:采集環(huán)境音;提取環(huán)境音的梅爾頻率倒譜系數(shù)MFCC特征值以便生成語譜圖;將語譜圖輸入至聲音識別模型識別音頻類型,其中,音頻類型至少包括背景音;將語譜圖輸入至音量識別模型識別音量大小;若音頻類型中包含用戶話音,則根據(jù)用戶話音的音量大小反向調節(jié)音箱音量;若音頻類型中不包含用戶話音,則根據(jù)背景音的音量大小正向調節(jié)音箱音量。
可選地,該方法還包括:采集樣本環(huán)境音;提取樣本環(huán)境音的MFCC特征值以便生成樣本語譜圖;對樣本語譜圖對應的音頻類型作標注,生成音頻標注文件;基于樣本語譜圖和音頻標注文件訓練聲音識別模型。
可選地,該方法還包括:采集樣本環(huán)境音;提取樣本環(huán)境音的MFCC特征值以便生成樣本語譜圖;對樣本語譜圖對應的音量大小進行標注,生成音量標注文件,其中,將音量按照由大到小分為第一類音量、第二類音量和第三類音量;基于樣本語譜圖和音量標注文件訓練音量識別模型。
可選地,基于聲音識別模型識別不同用戶的話音;和/或基于音量識別模型,識別不同用戶話音的音量大小。
可選地,若用戶話音的音量屬于第三類音量,則調高音箱音量;若用戶話音的音量屬于第一類音量,則調低音箱音量;若用戶話音的音量屬于第二類音量,則保持音箱音量不變。
可選地,若背景音的音量屬于第三類音量,則調低音箱音量;若背景音的音量屬于第一類音量,則調高音箱音量;若背景音的音量屬于第二類音量,則保持音箱音量不變。
可選地,該方法還包括:響應于用戶在前次音箱音量自動調節(jié)后手工調整音箱音量,根據(jù)手工調整音量情況修正根據(jù)聲音識別模型和音量識別模型自動調節(jié)的音箱音量。
可選地,聲音識別模型和音量識別模型為卷積神經(jīng)網(wǎng)絡模型或循環(huán)神經(jīng)網(wǎng)絡模型。
可選地,在節(jié)目切換間隙采集環(huán)境音。
根據(jù)本公開的另一方面,還提出一種音箱音量自動調節(jié)的系統(tǒng),包括:聲音采集模塊,用于采集環(huán)境音;聲音特征提取模塊,用于提取環(huán)境音的梅爾頻率倒譜系數(shù)MFCC特征值以便生成語譜圖;聲音識別模塊,用于將語譜圖輸入至聲音識別模型識別音頻類型,其中,音頻類型至少包括背景音;音量識別模塊,用于將語譜圖輸入至音量識別模型識別音量大小;音量調節(jié)模塊,用于若音頻類型中包含用戶話音,則根據(jù)用戶話音的音量大小反向調節(jié)音箱音量,若音頻類型中不包含用戶話音,則根據(jù)背景音的音量大小正向調節(jié)音箱音量。
可選地,該系統(tǒng)還包括音頻標注模塊和聲音識別模型訓練模塊,其中,聲音采集模塊還用于采集樣本環(huán)境音;聲音特征提取模塊還用于提取樣本環(huán)境音的MFCC特征值以便生成樣本語譜圖;音頻標注模塊用于對樣本語譜圖對應的音頻類型作標注,生成音頻標注文件;聲音識別模型訓練模塊用于基于樣本語譜圖和音頻標注文件訓練聲音識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810808588.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:耳機裝配件及防水耳機
- 下一篇:音響和音響系統(tǒng)





