[發(fā)明專利]高速公路口禮貌用語評(píng)分方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910181668.3 | 申請(qǐng)日: | 2019-03-11 |
| 公開(公告)號(hào): | CN109887498A | 公開(公告)日: | 2019-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 盧朝陽;周云蝶;李靜 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號(hào): | G10L15/14 | 分類號(hào): | G10L15/14;G10L15/26;G10L25/24;G10L25/69 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 王品華;朱紅星 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 測試語音 特征參數(shù) 預(yù)處理 初始檢索結(jié)果 檢索結(jié)果 禮貌用語 網(wǎng)絡(luò)模型 高速公路 匹配 特征參數(shù)提取 關(guān)鍵詞檢索 特征提取 孤立詞 魯棒性 語料庫 正確率 并行 重復(fù) 監(jiān)督 管理 | ||
本發(fā)明公開了一種高速公路口禮貌用語評(píng)分方法,主要解決現(xiàn)有人工監(jiān)督收費(fèi)員時(shí)重復(fù)枯燥且易疏忽的問題。其實(shí)現(xiàn)方案為:對(duì)語料庫文件進(jìn)行預(yù)處理,完成24維MFCC特征參數(shù)提取,并對(duì)特征參數(shù)進(jìn)行訓(xùn)練,得到關(guān)鍵詞和Filler并行的網(wǎng)絡(luò)模型;對(duì)測試語音完成預(yù)處理和特征提取后,得到測試語音特征參數(shù),并對(duì)測試語音特征參數(shù)與得到的網(wǎng)絡(luò)模型進(jìn)行匹配,得到初始檢索結(jié)果;對(duì)初始檢索結(jié)果與孤立詞模型進(jìn)行匹配,得到最終檢索結(jié)果,若檢索結(jié)果中包含所有關(guān)鍵詞,則判為100分,否則,缺y個(gè)關(guān)鍵詞,則判為100?y*100/m分。本發(fā)明具有良好的魯棒性,且關(guān)鍵詞檢索的正確率較高,誤識(shí)率較低,適用于高速公路口管理。
技術(shù)領(lǐng)域
本發(fā)明屬于語音關(guān)鍵詞檢索技術(shù)領(lǐng)域,特別涉及一種禮貌用語評(píng)分方法,可用于高速公路口收費(fèi)站。
技術(shù)背景
把人類中簡單重復(fù)的工作由機(jī)器代替一直是人們研究機(jī)器化發(fā)展的最初動(dòng)力,人與機(jī)器進(jìn)行交流是目前人工智能的發(fā)展要求之一。作為一種實(shí)現(xiàn)人類與機(jī)器直接“對(duì)話”的技術(shù),語音識(shí)別技術(shù)可以很便利地將語音信號(hào)轉(zhuǎn)換成相應(yīng)的機(jī)器語言,進(jìn)而實(shí)現(xiàn)無障礙交流。
在現(xiàn)如今的人類工作生活中,有些工作需要通過檢測工作人員的禮貌用語標(biāo)準(zhǔn)與否來評(píng)估工作狀況,例如高速公路口的收費(fèi)站工作人員就需要說完規(guī)定的某些禮貌用語方才達(dá)標(biāo)。而這些檢測和評(píng)估的重復(fù)類工作一旦由機(jī)器代替,在一定程度上就減輕了管理者的工作負(fù)擔(dān)和提升了管理效果。因而實(shí)現(xiàn)一些場景下的關(guān)鍵詞語音識(shí)別顯得尤為有用,且能對(duì)非特定人的被評(píng)估人員進(jìn)行評(píng)分。
我國具有五千年文明歷史,素有“禮儀之邦”之稱,中華民族也以彬彬有禮的風(fēng)貌而著稱于世。禮儀文明作為我國傳統(tǒng)文化的一個(gè)重要組成部分,其內(nèi)容十分豐富,涉及的范圍十分廣泛,幾乎滲透于社會(huì)的各個(gè)方面。例如高速公路口收費(fèi)站的工作人員在與過往司機(jī)交流時(shí)就需要說一些禮貌用語,收費(fèi)站的工作人員是否使用特定禮貌用語和使用頻數(shù)是管理員評(píng)估他們工作的重要依據(jù)。
現(xiàn)有的監(jiān)督評(píng)估工作在行為交流上已由視頻監(jiān)控承擔(dān),例如大華高速公路視頻監(jiān)控系統(tǒng)中的收費(fèi)站子系統(tǒng)就連續(xù)24小時(shí)全天監(jiān)控收費(fèi)亭內(nèi)收費(fèi)員的工作情況,但這種方法只能監(jiān)測到收費(fèi)員的禮貌動(dòng)作,在語音交流上的監(jiān)督評(píng)估仍是由人工完成的,需要管理員全程監(jiān)督,過程重復(fù)枯燥,而且還需要為每個(gè)收費(fèi)亭專門設(shè)置管理員的職位,浪費(fèi)勞動(dòng)力。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)上述現(xiàn)有技術(shù)的不足,提出一種高速公路口禮貌用語評(píng)分系統(tǒng),以實(shí)現(xiàn)對(duì)收費(fèi)員語音監(jiān)控的智能化,便利管理者對(duì)收費(fèi)員工作的監(jiān)督和評(píng)估。
為實(shí)現(xiàn)上述目的,本發(fā)明包括:
(1)選定高速公路口收費(fèi)員m個(gè)禮貌用語作為關(guān)鍵詞,選取n人作為發(fā)音者,每個(gè)人對(duì)每個(gè)關(guān)鍵詞完整并清晰地說x遍,總共得m×n×x條WAV文件作為語料庫文件;
(2)構(gòu)建關(guān)鍵詞模型和Filler模型并行的網(wǎng)絡(luò)模型:
2a)對(duì)每個(gè)關(guān)鍵詞的語料庫文件依次進(jìn)行預(yù)加重、分幀加漢明窗的預(yù)處理,得到一幀一幀的語音數(shù)據(jù),從該語音數(shù)據(jù)中提取24維梅爾頻率倒譜系數(shù)MFCC作為特征參數(shù);采用Baum-Welch算法對(duì)該特征參數(shù)進(jìn)行訓(xùn)練,得到該關(guān)鍵詞的隱馬爾科夫模型HMM參數(shù)模型;
2b)將高速公路可預(yù)測的非禮貌語音音節(jié)作為非關(guān)鍵詞,用與2a)相同的方法建立非關(guān)鍵詞HMM模型;用與2a)相同的方法對(duì)靜音建立單狀態(tài)HMM模型,用非關(guān)鍵詞模型和靜音模型組成Filler模型;
2c)將關(guān)鍵詞模型和Filler模型并行設(shè)置,組成無語法約束的網(wǎng)絡(luò)模型;
(3)選取k人作為測試發(fā)音者,每個(gè)人分別對(duì)包含1到m個(gè)關(guān)鍵詞的m個(gè)語音段說一遍,總共得到k×m!條WAV文件,作為語音測試文件;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910181668.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種視頻數(shù)據(jù)快速特征檢索的方法及系統(tǒng)
- 用于評(píng)估對(duì)象的整體特征狀態(tài)的方法和裝置
- 一種特征參數(shù)的調(diào)整方法、裝置和電子設(shè)備
- 廣告投放方法和系統(tǒng)
- 一種信息提示的方法及裝置
- 點(diǎn)讀對(duì)象處理方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種用于對(duì)發(fā)票變票虛開行為進(jìn)行監(jiān)控的方法及系統(tǒng)
- 一種將語音轉(zhuǎn)換為文字的方法、裝置及系統(tǒng)
- 檢測數(shù)據(jù)處理方法
- 面向家居多特征參數(shù)融合的聲紋識(shí)別方法
- 電鍍預(yù)處理溶液和電鍍預(yù)處理方法
- 鐵水預(yù)處理方法及其預(yù)處理裝置
- 預(yù)處理裝置及其預(yù)處理方法
- 預(yù)處理組件、使用該預(yù)處理組件進(jìn)行試樣的預(yù)處理的預(yù)處理裝置及包括該預(yù)處理裝置的分析系統(tǒng)
- 待測樣品預(yù)處理裝置、預(yù)處理筒及預(yù)處理方法
- 醋酸纖維卷曲預(yù)處理裝置、預(yù)處理液及預(yù)處理方法
- 預(yù)處理裝置
- 預(yù)處理濾芯
- 甘薯儲(chǔ)藏預(yù)處理設(shè)備及預(yù)處理方法
- 水樣預(yù)處理裝置、水樣預(yù)處理系統(tǒng)及水樣預(yù)處理方法





