[發(fā)明專利]場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備有效

申請?zhí)枺?/td>	201910731749.6	申請日：	2019-08-08
公開（公告）號：	CN110473568B	公開（公告）日：	2022-01-07
發(fā)明（設(shè)計）人：	宋天龍	申請（專利權(quán)）人：	OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司
主分類號：	G10L25/51	分類號：	G10L25/51;G10L25/30;G10L25/24;G10L25/21
代理公司：	深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300	代理人：	黃威
地址：	523860 廣東***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	場景識別方法裝置存儲介質(zhì) 電子設(shè)備
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例公開了一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備，其中，本申請實施例首先采集得到待識別場景的雙通道音頻信號，然后通過基于雙通道音頻信號的預(yù)測方案1以及基于雙通道音頻信號合成得到的單通道音頻信號的預(yù)測方案2，獲取得到待識別場景的兩個候選場景分類結(jié)果，再融合兩個候選場景分類結(jié)果得到待識別場景的目標(biāo)場景分類結(jié)果。由此，無需結(jié)合定位技術(shù)來實現(xiàn)對電子設(shè)備所處場景的識別，也就對電子設(shè)備所處的環(huán)境無任何限制，相較于相關(guān)技術(shù)，本申請能夠更靈活準(zhǔn)確的對電子設(shè)備所處的待識別場景進(jìn)行識別。

技術(shù)領(lǐng)域

本申請涉及場景識別技術(shù)領(lǐng)域，具體涉及一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備。

背景技術(shù)

目前，如平板電腦、手機等電子設(shè)備可以通過分析用戶所處的場景，根據(jù)分析結(jié)果進(jìn)行對應(yīng)的處理操作，由此來提升用戶體驗。相關(guān)技術(shù)中，電子設(shè)備在分析用戶所處的場景時，通常利用GPS定位來實現(xiàn)，即通過GPS定位獲得當(dāng)前的位置信息，根據(jù)該位置信息來確定電子設(shè)備所處的場景，也即是用戶所處的場景。然而，對于室內(nèi)，或者較多遮蔽物的環(huán)境中，相關(guān)技術(shù)難以實現(xiàn)GPS定位，也就無法對電子設(shè)備所處的環(huán)境場景進(jìn)行識別。

發(fā)明內(nèi)容

本申請實施例提供了一種場景識別方法、裝置、存儲介質(zhì)及電子設(shè)備，能夠?qū)﹄娮釉O(shè)備所處的環(huán)境場景進(jìn)行識別。

第一方面，本申請實施例了提供了的一種場景識別方法，應(yīng)用于電子設(shè)備，該電子設(shè)備包括兩個麥克風(fēng)，該場景識別方法包括：

通過所述兩個麥克風(fēng)對待識別場景進(jìn)行音頻采集，得到雙通道音頻信號；

按照第一預(yù)設(shè)特征提取策略提取所述雙通道音頻信號的第一聲學(xué)特征，并調(diào)用預(yù)先訓(xùn)練的第一場景分類模型基于所述第一聲學(xué)特征進(jìn)行場景分類，得到第一候選場景分類結(jié)果；

對所述雙通道音頻信號進(jìn)行音頻合成處理，得到單通道音頻信號；

按照第二預(yù)設(shè)特征提取策略提取所述單通道音頻信號的第二聲學(xué)特征，并調(diào)用預(yù)先訓(xùn)練的第二場景分類模型基于所述第二聲學(xué)特征進(jìn)行場景分類，得到第二候選場景分類結(jié)果；

根據(jù)所述第一候選場景分類結(jié)果以及所述第二候選場景分類結(jié)果，獲取所述待識別場景的目標(biāo)場景分類結(jié)果。

第二方面，本申請實施例了提供了的一種場景識別裝置，應(yīng)用于電子設(shè)備，該電子設(shè)備包括兩個麥克風(fēng)，該場景識別裝置包括：

音頻采集模塊，用于通過所述兩個麥克風(fēng)對待識別場景進(jìn)行音頻采集，得到雙通道音頻信號；

第一分類模塊，用于按照第一預(yù)設(shè)特征提取策略提取所述雙通道音頻信號的第一聲學(xué)特征，并調(diào)用預(yù)先訓(xùn)練的第一場景分類模型基于所述第一聲學(xué)特征進(jìn)行場景分類，得到第一候選場景分類結(jié)果；

音頻合成模塊，用于對所述雙通道音頻信號進(jìn)行音頻合成處理，得到單通道音頻信號；

第二分類模塊，用于按照第二預(yù)設(shè)特征提取策略提取所述單通道音頻信號的第二聲學(xué)特征，并調(diào)用預(yù)先訓(xùn)練的第二場景分類模型基于所述第二聲學(xué)特征進(jìn)行場景分類，得到第二候選場景分類結(jié)果；

分類整合模塊，用于根據(jù)所述第一候選場景分類結(jié)果以及所述第二候選場景分類結(jié)果，獲取所述待識別場景的目標(biāo)場景分類結(jié)果。

第三方面，本申請實施例提供的存儲介質(zhì)，其上存儲有計算機程序，當(dāng)所述計算機程序被處理器調(diào)用時執(zhí)行如本申請任一實施例提供的場景識別方法。

第四方面，本申請實施例提供的電子設(shè)備，包括處理器和存儲器，所述存儲器有計算機程序，所述處理器通過調(diào)用所述計算機程序，用于執(zhí)行如本申請任一實施例提供的場景識別方法。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司，未經(jīng)OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910731749.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】