[發(fā)明專利]面向家居環(huán)境的智能哭聲檢測方法在審
| 申請?zhí)枺?/td> | 201810208673.4 | 申請日: | 2018-03-14 |
| 公開(公告)號: | CN108461091A | 公開(公告)日: | 2018-08-28 |
| 發(fā)明(設(shè)計)人: | 張暉;毛小旺 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L17/02;G10L17/04 |
| 代理公司: | 南京蘇科專利代理有限責(zé)任公司 32102 | 代理人: | 姚姣陽 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 哭聲檢測 家居環(huán)境 樣本數(shù)據(jù)庫 均值參數(shù) 判決系統(tǒng) 同類數(shù)據(jù) 訓(xùn)練樣本 業(yè)務(wù)體驗 音頻數(shù)據(jù) 智能終端 智能 差異性 單模型 樣本庫 準(zhǔn)確率 分類 檢測 服務(wù) | ||
本發(fā)明揭示了一種面向家居環(huán)境的智能哭聲檢測方法,本方法首先建立樣本數(shù)據(jù)庫,并對樣本庫中的數(shù)據(jù)進行分類訓(xùn)練GMM模型,再以GMM模型各個分量的均值參數(shù),作為SVM模型的訓(xùn)練樣本,訓(xùn)練出混合識別GMM?SVM模型。本方法可在智能終端本地進行哭聲檢測,擺脫對服務(wù)端的依賴,大大縮短了檢測周期,提升用戶的業(yè)務(wù)體驗。此外,本方法中的模型充分考慮了同類音頻數(shù)據(jù)之間的相似性和不同類數(shù)據(jù)之間的差異性,比單模型判決系統(tǒng)具有更佳的識別準(zhǔn)確率,且識別速率也能極大提升,為哭聲檢測產(chǎn)品中提供了優(yōu)秀的解決方案。
技術(shù)領(lǐng)域
本發(fā)明涉及一種檢測方法,具體涉及一種面向家居環(huán)境的智能哭聲檢測方法,屬于智能家居領(lǐng)域。
背景技術(shù)
近年來,隨著人工智能、機器學(xué)習(xí)領(lǐng)域的快速發(fā)展,越來越多的業(yè)務(wù)、產(chǎn)品被貼上智能化標(biāo)簽。這些新業(yè)務(wù)相對傳統(tǒng)業(yè)務(wù),滿足了人們因物質(zhì)生活水平的提高,而日益增長的個性化、定制化的業(yè)務(wù)需求。
具體而言,嬰幼兒是家庭的重要成員,需要得到家長的額外照顧。又由于其身心仍處于發(fā)育階段、尚未成熟,因此對于新生嬰兒來說,妥善的照顧是不可或缺的。一般而言,新生嬰兒僅能藉由哭泣的方式表達情緒與需求,而在不同的情緒或需求下其所發(fā)出的哭聲也有所不同。因此,嬰兒的父母或照護人可以依據(jù)新生嬰兒的哭聲來概略判斷嬰兒的需求與情緒,進而采取不同的行動。
正是由于上述兩方面的原因,針對年輕父母因工作或家務(wù)繁忙,容易對新生嬰兒疏于看護的社會現(xiàn)象,目前市面上出現(xiàn)了多種智能哭聲檢測技術(shù),也有廠商研發(fā)了相關(guān)的嬰兒哭聲檢測產(chǎn)品,如小米公司的小蟻攝像頭、360公司的水滴攝像機等,但此類產(chǎn)品大都采用的是“本地+云端”檢測架構(gòu),檢測周期長,對網(wǎng)絡(luò)質(zhì)量要求高;而智能終端本地只進行一些簡單功能實現(xiàn),過度依賴于服務(wù)端。此類產(chǎn)品雖然都貼上智能化的標(biāo)簽,但更確切的說,應(yīng)該是“偽智能”。
綜上所述,如何克服上述現(xiàn)有技術(shù)上的不足,提出一種面向家居環(huán)境的智能哭聲檢測方法,進而使產(chǎn)品擺脫對云端的依賴,縮短檢測周期,提升用戶的業(yè)務(wù)體驗,就成為了本領(lǐng)域內(nèi)的技術(shù)人員亟待解決的問題。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)存在上述缺陷,本發(fā)明的目的是提出一種面向家居環(huán)境的智能哭聲檢測方法。
本發(fā)明的目的,將通過以下技術(shù)方案得以實現(xiàn):
一種面向家居環(huán)境的智能哭聲檢測方法,包括如下步驟,
S1,采集哭聲與非哭聲語音信號,分兩類存入樣本庫;并對樣本庫中各類語音信號進行預(yù)處理,得到各類語音信號對應(yīng)的語音幀序列;
S2,對S1中所述語音幀序列中每一幀,提取24維的音頻特征,得到各類語音信號對應(yīng)特征向量序列;
S3,以S2中所述特征向量序列,作為GMM訓(xùn)練樣本,采用EM算法,分別訓(xùn)練哭聲GMM模型和非哭聲GMM模型;并提取訓(xùn)練好的GMM模型中各個高斯分量的均值參數(shù),組成均值向量序列;
S4,對S3所述均值向量序列中每一個向量,添加類別標(biāo)簽,并保存到均值特征樣本集;并以均值特征樣本集作為訓(xùn)練樣本,訓(xùn)練SVM模型;
S5,采集待識別的音頻信號,并按照S1至S2的方法,提取信號對應(yīng)的音頻特征序列;其次,將音頻特征序列中每一幀信號,與S3中所述均值向量序列中每一個均值向量,計算二者的似然概率,取概率最大值所對應(yīng)的均值向量,作為GMM模型對該幀信號的判決結(jié)果;最后,遍歷音頻特征序列中所有幀,得到均值向量序列X={X1,X2,...,Xp,...,XL};其中,Xp為第p幀信號對應(yīng)的均值向量,L為音頻特征序列長度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810208673.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:語音信號處理裝置及語音信號處理方法
- 下一篇:一種對帕金森病語音分析的方法
- 樣本數(shù)據(jù)收集系統(tǒng)
- 超解像系統(tǒng)中圖像樣本數(shù)據(jù)庫的更新方法及圖像服務(wù)器
- 水電機組故障診斷方法
- 一種光譜數(shù)據(jù)分析方法及裝置
- 一種基于出生缺陷生物樣本庫的管理系統(tǒng)
- 顏色匹配樣本數(shù)據(jù)庫以及用于顏色匹配樣本數(shù)據(jù)庫的系統(tǒng)和方法
- 體型樣本數(shù)據(jù)庫的生成方法、裝置及計算機可讀存儲介質(zhì)
- 基于深度學(xué)習(xí)的駕駛員行為檢測方法和系統(tǒng)
- 一種高噪聲環(huán)境下輔助聽力的方法及裝置
- 語義匹配模型訓(xùn)練方法、匹配方法、裝置、設(shè)備及存儲介質(zhì)





