[發(fā)明專利]場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 201910731749.6 | 申請日: | 2019-08-08 |
| 公開(公告)號: | CN110473568B | 公開(公告)日: | 2022-01-07 |
| 發(fā)明(設(shè)計)人: | 宋天龍 | 申請(專利權(quán))人: | OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G10L25/24;G10L25/21 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300 | 代理人: | 黃威 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 場景 識別 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
本申請實施例公開了一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備,其中,本申請實施例首先采集得到待識別場景的雙通道音頻信號,然后通過基于雙通道音頻信號的預(yù)測方案1以及基于雙通道音頻信號合成得到的單通道音頻信號的預(yù)測方案2,獲取得到待識別場景的兩個候選場景分類結(jié)果,再融合兩個候選場景分類結(jié)果得到待識別場景的目標(biāo)場景分類結(jié)果。由此,無需結(jié)合定位技術(shù)來實現(xiàn)對電子設(shè)備所處場景的識別,也就對電子設(shè)備所處的環(huán)境無任何限制,相較于相關(guān)技術(shù),本申請能夠更靈活準(zhǔn)確的對電子設(shè)備所處的待識別場景進(jìn)行識別。
技術(shù)領(lǐng)域
本申請涉及場景識別技術(shù)領(lǐng)域,具體涉及一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備。
背景技術(shù)
目前,如平板電腦、手機等電子設(shè)備可以通過分析用戶所處的場景,根據(jù)分析結(jié)果進(jìn)行對應(yīng)的處理操作,由此來提升用戶體驗。相關(guān)技術(shù)中,電子設(shè)備在分析用戶所處的場景時,通常利用GPS定位來實現(xiàn),即通過GPS定位獲得當(dāng)前的位置信息,根據(jù)該位置信息來確定電子設(shè)備所處的場景,也即是用戶所處的場景。然而,對于室內(nèi),或者較多遮蔽物的環(huán)境中,相關(guān)技術(shù)難以實現(xiàn)GPS定位,也就無法對電子設(shè)備所處的環(huán)境場景進(jìn)行識別。
發(fā)明內(nèi)容
本申請實施例提供了一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備,能夠?qū)﹄娮釉O(shè)備所處的環(huán)境場景進(jìn)行識別。
第一方面,本申請實施例了提供了的一種場景識別方法,應(yīng)用于電子設(shè)備,該電子設(shè)備包括兩個麥克風(fēng),該場景識別方法包括:
通過所述兩個麥克風(fēng)對待識別場景進(jìn)行音頻采集,得到雙通道音頻信號;
按照第一預(yù)設(shè)特征提取策略提取所述雙通道音頻信號的第一聲學(xué)特征,并調(diào)用預(yù)先訓(xùn)練的第一場景分類模型基于所述第一聲學(xué)特征進(jìn)行場景分類,得到第一候選場景分類結(jié)果;
對所述雙通道音頻信號進(jìn)行音頻合成處理,得到單通道音頻信號;
按照第二預(yù)設(shè)特征提取策略提取所述單通道音頻信號的第二聲學(xué)特征,并調(diào)用預(yù)先訓(xùn)練的第二場景分類模型基于所述第二聲學(xué)特征進(jìn)行場景分類,得到第二候選場景分類結(jié)果;
根據(jù)所述第一候選場景分類結(jié)果以及所述第二候選場景分類結(jié)果,獲取所述待識別場景的目標(biāo)場景分類結(jié)果。
第二方面,本申請實施例了提供了的一種場景識別裝置,應(yīng)用于電子設(shè)備,該電子設(shè)備包括兩個麥克風(fēng),該場景識別裝置包括:
音頻采集模塊,用于通過所述兩個麥克風(fēng)對待識別場景進(jìn)行音頻采集,得到雙通道音頻信號;
第一分類模塊,用于按照第一預(yù)設(shè)特征提取策略提取所述雙通道音頻信號的第一聲學(xué)特征,并調(diào)用預(yù)先訓(xùn)練的第一場景分類模型基于所述第一聲學(xué)特征進(jìn)行場景分類,得到第一候選場景分類結(jié)果;
音頻合成模塊,用于對所述雙通道音頻信號進(jìn)行音頻合成處理,得到單通道音頻信號;
第二分類模塊,用于按照第二預(yù)設(shè)特征提取策略提取所述單通道音頻信號的第二聲學(xué)特征,并調(diào)用預(yù)先訓(xùn)練的第二場景分類模型基于所述第二聲學(xué)特征進(jìn)行場景分類,得到第二候選場景分類結(jié)果;
分類整合模塊,用于根據(jù)所述第一候選場景分類結(jié)果以及所述第二候選場景分類結(jié)果,獲取所述待識別場景的目標(biāo)場景分類結(jié)果。
第三方面,本申請實施例提供的存儲介質(zhì),其上存儲有計算機程序,當(dāng)所述計算機程序被處理器調(diào)用時執(zhí)行如本申請任一實施例提供的場景識別方法。
第四方面,本申請實施例提供的電子設(shè)備,包括處理器和存儲器,所述存儲器有計算機程序,所述處理器通過調(diào)用所述計算機程序,用于執(zhí)行如本申請任一實施例提供的場景識別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司,未經(jīng)OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910731749.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





