[發(fā)明專利]一種基于食品安全語料數(shù)據(jù)的語音匹配方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610009314.7 | 申請(qǐng)日: | 2016-01-07 |
| 公開(公告)號(hào): | CN105741842A | 公開(公告)日: | 2016-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 鄭麗敏;黃斌;楊璐;王炳蔚 | 申請(qǐng)(專利權(quán))人: | 中國農(nóng)業(yè)大學(xué) |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G10L25/51 |
| 代理公司: | 北京衛(wèi)平智業(yè)專利代理事務(wù)所(普通合伙) 11392 | 代理人: | 董琪 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 食品安全 語料 數(shù)據(jù) 語音 匹配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于食品安全語料數(shù)據(jù)的語音匹配方法,尤其是一種針對(duì)食品安全領(lǐng)域的語音匹配方法。
背景技術(shù)
隨著經(jīng)濟(jì)的不斷發(fā)展,食品安全問題表現(xiàn)的尤為突出,每年我國因食品安全事件造成的損失日益嚴(yán)重,食品安全事件已成為我國高度重視的重大安全事件。
伴隨著網(wǎng)絡(luò)的快速發(fā)展,傳統(tǒng)的新聞報(bào)道也大量的出現(xiàn)在網(wǎng)絡(luò)中,語音數(shù)據(jù)作為傳統(tǒng)的新聞載體,承載了廣泛的信息量,從廣泛的音頻數(shù)據(jù)中挖掘出有意義的食品安全信息顯得尤為重要。傳統(tǒng)的識(shí)別方法大多數(shù)針對(duì)文本進(jìn)行,音頻類的數(shù)據(jù)常常優(yōu)先轉(zhuǎn)換為文本信息,在進(jìn)行匹配識(shí)別,匹配速度較慢,本發(fā)明針對(duì)食品安全方面的音頻數(shù)據(jù),實(shí)現(xiàn)方便、快捷的基于語音的匹配方法。
發(fā)明內(nèi)容
本發(fā)明公布了一種基于食品安全語料數(shù)據(jù)的語音匹配方法,主要實(shí)現(xiàn)了對(duì)音頻數(shù)據(jù)的語義識(shí)別過程。
本發(fā)明采用以下技術(shù)方案:一種基于食品安全語料數(shù)據(jù)的語音匹配方法,所述語音匹配方法,包括音頻信號(hào)的預(yù)處理、語音信號(hào)的特征提取、食品安全語料庫的構(gòu)建、基于一種改進(jìn)的DTW語音識(shí)別算法。
音頻信號(hào)的預(yù)處理,采用譜減法去噪、一階濾波器進(jìn)行預(yù)加重處理和使用漢明窗加窗分幀。
語音信號(hào)的特征提取采用倒譜方法提取基頻,按原則歸并特征序列,語音信號(hào)的特征通過梅爾倒頻參數(shù)(MFCC)及其一階差分系數(shù)提取。
所述食品安全語料庫,食品分類標(biāo)準(zhǔn)參照GB2760-2014標(biāo)準(zhǔn),將食品主要分為肉蛋奶三個(gè)大類,一百多個(gè)小類,這些關(guān)鍵詞是對(duì)這三大類的詳細(xì)分類,語料庫還包含食品添加劑、食品違禁項(xiàng)等相關(guān)的關(guān)鍵詞。構(gòu)建一個(gè)評(píng)價(jià)公式,對(duì)每個(gè)識(shí)別的音頻進(jìn)行一個(gè)評(píng)價(jià)。根據(jù)這個(gè)評(píng)價(jià)得分的高低來判斷這一個(gè)音頻與食品事件的相關(guān)程度。
所述語音識(shí)別算法為基于動(dòng)態(tài)時(shí)間規(guī)整(DWT)的改進(jìn)算法,不斷地計(jì)算兩矢量之間的距離以尋找最優(yōu)的匹配路徑。同時(shí)建立多個(gè)模型以提高匹配成功率。
本發(fā)明使用食品安全語料庫完成音頻數(shù)據(jù)的語音匹配過程,較文本匹配方式更為快捷、方便,且準(zhǔn)確率較高,設(shè)置音頻數(shù)據(jù)與食品事件的關(guān)聯(lián)度評(píng)分,可以準(zhǔn)確的評(píng)價(jià)音頻與食品的相關(guān)程度。本發(fā)明可以作為先進(jìn)的技術(shù)運(yùn)用于食品檢測等領(lǐng)域。
附圖說明
圖1為本發(fā)明的技術(shù)路線
圖2為本發(fā)明Mel頻率與實(shí)際頻率的對(duì)應(yīng)轉(zhuǎn)換關(guān)系圖
具體實(shí)施方式
本發(fā)明使用一種基于食品安全語料數(shù)據(jù)的語音匹配方法,對(duì)音頻進(jìn)行預(yù)處理,提取語音信號(hào)的特征,構(gòu)建食品安全語料庫,使用語料庫進(jìn)行匹配。以下就本發(fā)明作具體的說明。
本發(fā)明包含音頻信號(hào)的預(yù)處理、語音信號(hào)的特征提取、食品安全語料庫的構(gòu)建。
附圖1示出了本發(fā)明的技術(shù)路線。
音頻信號(hào)的預(yù)處理包含去噪、預(yù)加重、加窗分幀。
去噪采用譜減法進(jìn)行去噪,減少語音中噪聲的干擾。
預(yù)加重的目的是提高語音信號(hào)的高頻部分,使信號(hào)的頻譜變得平坦,便于后續(xù)的分析。預(yù)加重使用6dB/倍頻程的提高高頻特性的預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn),它是一個(gè)一階FIR濾波器:
H(z)=1-a*z-1
其中,系數(shù)a一般選擇[0,9.1]之間的數(shù)值,經(jīng)多次實(shí)驗(yàn)分析,本發(fā)明選取a=0.9375。
加窗分幀是通過加窗來截取一段語音信號(hào)進(jìn)行分析。同時(shí)相鄰兩幀要設(shè)置交疊,稱為幀移,本發(fā)明采用漢明窗進(jìn)行加窗分幀,采用256個(gè)采樣點(diǎn)的窗口長度,幀移位窗口長度的50%,即128個(gè)采樣點(diǎn)。
特征提取采用梅爾頻率倒譜系數(shù)作為音頻識(shí)別特征,Mel頻率與實(shí)際頻率的對(duì)應(yīng)轉(zhuǎn)換關(guān)系如圖2,公式:
Mel(f)=2595lg(1+f/700)
MFCC系數(shù)具體計(jì)算如下:
(1)對(duì)經(jīng)過預(yù)處理的語音信號(hào)求其短時(shí)傅里葉變換得到其頻譜。
(2)求取它的能量譜,并利用一組三角形濾波器在頻域范圍內(nèi)進(jìn)行濾波;將每個(gè)濾波器頻帶內(nèi)的能量進(jìn)行疊加,得到輸出。
(3)將濾波器組的輸出取對(duì)數(shù),得到相對(duì)應(yīng)的對(duì)數(shù)功率譜,進(jìn)行反離散余弦變換DCT得到MFCC系數(shù),如下式:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國農(nóng)業(yè)大學(xué),未經(jīng)中國農(nóng)業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610009314.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于本體的食品安全事件語義檢索系統(tǒng)
- 基于物聯(lián)網(wǎng)的食品安全檢測系統(tǒng)
- 一種食品安全信息記錄方法、查詢方法及監(jiān)督方法
- 一種進(jìn)口食品安全綜合指數(shù)的計(jì)算方法
- 一種基于云計(jì)算的食品安全預(yù)警系統(tǒng)
- 食品安全風(fēng)險(xiǎn)識(shí)別方法與系統(tǒng)
- 一種食品安全關(guān)聯(lián)圖譜構(gòu)建方法及系統(tǒng)
- 基于圖卷積神經(jīng)網(wǎng)絡(luò)模型的食品安全事件檢測方法及系統(tǒng)
- 食品安全風(fēng)險(xiǎn)等級(jí)預(yù)測方法、裝置及電子設(shè)備
- 基于大數(shù)據(jù)的食品信息檢測方法及系統(tǒng)
- 一種語料提取器及提取語料的方法
- 軍事信息語料庫構(gòu)建方法及系統(tǒng)
- 待標(biāo)注語料的分配方法、裝置、可讀存儲(chǔ)介質(zhì)及電子設(shè)備
- 語料泛化方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語料數(shù)據(jù)的處理方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 一種擴(kuò)展語料挖掘方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 語料生成方法、語料生成裝置、和存儲(chǔ)介質(zhì)
- 短語語料獲取方法及短語語料獲取裝置
- 一種語料分類方法、裝置及服務(wù)器
- 一種輸入方法、裝置和電子設(shè)備
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





