[發(fā)明專利]基于聲音分析的終端處理方法、裝置、存儲(chǔ)介質(zhì)及終端有效
| 申請(qǐng)?zhí)枺?/td> | 201911325074.1 | 申請(qǐng)日: | 2019-12-20 |
| 公開(公告)號(hào): | CN111081275B | 公開(公告)日: | 2023-05-26 |
| 發(fā)明(設(shè)計(jì))人: | 李巖 | 申請(qǐng)(專利權(quán))人: | 惠州TCL移動(dòng)通信有限公司 |
| 主分類號(hào): | G10L25/27 | 分類號(hào): | G10L25/27;G10L25/30;G10L25/51;H04M1/72448;H04M1/72454 |
| 代理公司: | 深圳紫藤知識(shí)產(chǎn)權(quán)代理有限公司 44570 | 代理人: | 楊艇要 |
| 地址: | 516006 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 聲音 分析 終端 處理 方法 裝置 存儲(chǔ) 介質(zhì) | ||
1.一種基于聲音分析的終端處理方法,其特征在于,包括:
采集當(dāng)前場(chǎng)景下的聲音信息;
對(duì)所述聲音信息進(jìn)行分析,得到分析結(jié)果;
對(duì)所述聲音信息進(jìn)行去噪處理,并將去噪后的聲音信息輸入到訓(xùn)練好的AI算法模型中,以從所述聲音信息中提取聲音特征,所述聲音特征至少包括頻譜、速度、音色、音調(diào)、音量以及響度,其中,所述訓(xùn)練好的AI算法模型為根據(jù)常用的聲音音源數(shù)據(jù)對(duì)AI算法模型進(jìn)行模型訓(xùn)練得到;
根據(jù)所述聲音特征對(duì)所述聲音信息進(jìn)行識(shí)別,得到識(shí)別結(jié)果;
基于所述識(shí)別結(jié)果確定所述聲音信息中包含的聲音種類、聲音種類數(shù)量、聲源數(shù)量、聲音特性參數(shù),所述聲音種類包括不同聲源產(chǎn)生的聲音,所述聲音特性參數(shù)包括音色、音量以及響度;
至少根據(jù)所述聲音種類、所述聲音種類數(shù)量、聲源數(shù)量、聲音特性參數(shù),生成所述分析結(jié)果;
基于所述分析結(jié)果從多個(gè)樣本場(chǎng)景類型中,確定當(dāng)前場(chǎng)景的所屬類型,其中,所述多個(gè)樣本場(chǎng)景類型至少包括:嘈雜場(chǎng)景、危險(xiǎn)場(chǎng)景和安靜場(chǎng)景,所述嘈雜場(chǎng)景包括多種不同種類的聲音以及多個(gè)聲源,所述危險(xiǎn)場(chǎng)景包括特殊聲源產(chǎn)生的聲音,所述安靜場(chǎng)景包括聲音分貝低的聲音;
執(zhí)行與當(dāng)前場(chǎng)景的所屬類型對(duì)應(yīng)的操作指令,包括:
若當(dāng)前場(chǎng)景的所屬類型為危險(xiǎn)場(chǎng)景,則獲取當(dāng)前的環(huán)境圖像信息;
基于當(dāng)前的地理位置、所述環(huán)境圖像信息以及所述分析結(jié)果,確定危險(xiǎn)區(qū)域的位置覆蓋范圍;
根據(jù)所述位置覆蓋范圍、當(dāng)前場(chǎng)景下的路況信息以及建筑物信息生成路線指引信息;
根據(jù)所述路線指引信息對(duì)用戶進(jìn)行信息提示。
2.根據(jù)權(quán)利要求1所述的基于聲音分析的終端處理方法,其特征在于,所述執(zhí)行與當(dāng)前場(chǎng)景的所屬類型對(duì)應(yīng)的操作指令,包括:
若當(dāng)前場(chǎng)景的所屬類型為嘈雜場(chǎng)景,則獲取當(dāng)前的地理位置;
確定所述地理位置是否處于預(yù)設(shè)區(qū)域內(nèi);
若是,則將當(dāng)前的信息提醒方式調(diào)整為震動(dòng)提醒。
3.根據(jù)權(quán)利要求2所述的基于聲音分析的終端處理方法,其特征在于,在確定所述地理位置處于預(yù)設(shè)區(qū)域內(nèi)之后,還包括:
當(dāng)檢測(cè)到終端播放第一音頻信號(hào)時(shí),對(duì)所述第一音頻信號(hào)進(jìn)行降噪處理。
4.根據(jù)權(quán)利要求1所述的基于聲音分析的終端處理方法,其特征在于,所述執(zhí)行與當(dāng)前場(chǎng)景的所屬類型對(duì)應(yīng)的操作指令,包括:
若當(dāng)前場(chǎng)景的所屬類型為安靜場(chǎng)景,則當(dāng)檢測(cè)到待播放的第二音頻信號(hào)時(shí),調(diào)整所述第二音頻信號(hào)的音量參數(shù)值至低于當(dāng)音量參數(shù)值。
5.一種基于聲音分析的終端處理裝置,其特征在于,包括:
采集單元,用于采集當(dāng)前場(chǎng)景下的聲音信息;
分析單元,用于對(duì)所述聲音信息進(jìn)行去噪處理,并將去噪后的聲音信息輸入到訓(xùn)練好的AI算法模型中,以從所述聲音信息中提取聲音特征,所述聲音特征至少包括頻譜、速度、音色、音調(diào)、音量以及響度,其中,所述訓(xùn)練好的AI算法模型為根據(jù)常用的聲音音源數(shù)據(jù)對(duì)AI算法模型進(jìn)行模型訓(xùn)練得到;根據(jù)所述聲音特征對(duì)所述聲音信息進(jìn)行識(shí)別,得到識(shí)別結(jié)果;基于所述識(shí)別結(jié)果確定所述聲音信息中包含的聲音種類、聲音種類數(shù)量、聲源數(shù)量、聲音特性參數(shù),所述聲音種類包括不同聲源產(chǎn)生的聲音,所述聲音特性參數(shù)包括音色、音量以及響度;至少根據(jù)所述聲音種類、所述聲音種類數(shù)量、聲源數(shù)量、聲音特性參數(shù),生成所述分析結(jié)果;
確定單元,用于基于所述分析結(jié)果從多個(gè)樣本場(chǎng)景類型中,確定當(dāng)前場(chǎng)景的所屬類型,其中,所述多個(gè)樣本場(chǎng)景類型至少包括:嘈雜場(chǎng)景、危險(xiǎn)場(chǎng)景和安靜場(chǎng)景,所述嘈雜場(chǎng)景包括多種不同種類的聲音以及多個(gè)聲源,所述危險(xiǎn)場(chǎng)景包括特殊聲源產(chǎn)生的聲音,所述安靜場(chǎng)景包括聲音分貝低的聲音;
處理單元,用于執(zhí)行與當(dāng)前場(chǎng)景的所屬類型對(duì)應(yīng)的操作指令,包括:若當(dāng)前場(chǎng)景的所屬類型為危險(xiǎn)場(chǎng)景,則獲取當(dāng)前的環(huán)境圖像信息;基于當(dāng)前的地理位置、所述環(huán)境圖像信息以及所述分析結(jié)果,確定危險(xiǎn)區(qū)域的位置覆蓋范圍;根據(jù)所述位置覆蓋范圍、當(dāng)前場(chǎng)景下的路況信息以及建筑物信息生成路線指引信息;根據(jù)所述路線指引信息對(duì)用戶進(jìn)行信息提示。
6.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)中存儲(chǔ)有多條指令,所述指令適于由處理器加載以執(zhí)行權(quán)利要求1-4任一項(xiàng)所述的基于聲音分析的終端處理方法。
7.一種終端,其特征在于,包括處理器及存儲(chǔ)器,所述處理器與所述存儲(chǔ)器電性連接,所述存儲(chǔ)器用于存儲(chǔ)指令和數(shù)據(jù);所述處理器用于執(zhí)行權(quán)利要求1-4任一項(xiàng)所述的基于聲音分析的終端處理方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于惠州TCL移動(dòng)通信有限公司,未經(jīng)惠州TCL移動(dòng)通信有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911325074.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





