[發明專利]一種基于聲音識別的教學考勤方法在審
| 申請號: | 201810608125.0 | 申請日: | 2018-06-13 |
| 公開(公告)號: | CN108806694A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 高艷艷;楊平平;于海波 | 申請(專利權)人: | 高艷艷;楊平平;于海波 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/18;G10L25/54;G10L25/30;G10L25/24;G01S5/18;G07C1/10 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 062450 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 考勤 學生 聲音識別 有效地 神經網絡結構 全局最優解 變異算子 大小判斷 課堂紀律 空間定位 神經網絡 聲紋識別 聲學模型 聲源位置 語音識別 基函數 拾音器 音量 處理器 聚類 聲紋 算法 教學 匹配 收斂 遺傳 語音 分類 監測 優化 講話 | ||
1.一種基于聲音識別的教學考勤方法,其特征在于,該方法包括:
步驟一、采集老師點名的聲音信號,對該原始信號采樣量化,把原始語音信號轉化成數字信號,對轉換成數字信號后的語音信號進行預加重、取音框、加窗、去噪的預處理;
步驟二、對預加重后每幀序列進行離散FFT變換,取模的平方得到離散功率譜S(n),計算S(n)通過M個帶通濾波器后得到的功率值Pm,計算Pm的自然對數,得到Lm,計算其離散余弦變換,得到Dm,舍去直流分量,得到MFCC參數,在數據庫內查找與該MFCC參數信息匹配的相對應姓名的學生個人信息;
步驟三、多個拾音器獲取答到學生的聲音,并在數據庫內查找該姓名的學生個人信息,對拾取的學生聲音進行預處理,通過遺傳算法獲得基函數的中心以及隱含層單元的高斯函數的寬度,設計編碼、交叉和變異算子,構建三層遺傳優化RBF神經網絡模型;
步驟四、處理器利用語音識別中的構建遺傳優化RBF神經網絡模型分別對該學生預處理后的聲音信號的不同音素上的語音特征進行分類,在毎個音素子空間內實現對特征降維,提取出說話人信息并用于提取DNN i-vector進行答到學生語音的聲紋識別;
步驟五、將識別出來的答到學生的聲紋,與數據庫中學生個人信息中的聲紋信息進行匹配,若匹配相似程度超過預設值,則判斷學生答到通過,若匹配相似程度不超過預設值,則向警報器發出報警信息;
步驟六、采用五個拾音器組成的陣列作為聲源定位獲取的耳朵,其中四個拾音器組成的平面陣確定聲源空間位置,另外一個拾音器輔助完成聲源位于拾音器前后方的判斷,并通過改進的時延算法實現答到學生聲源的空間定位,若答到學生的聲源位置超出預設的教室范圍,則判定學生遲到;
步驟七、教學過程中,拾音器實時獲取教室內的聲音,通過聲紋識別識別出老師、學生聲音,通過步驟六的聲源位置確定方法確定老師聲源及學生聲源的位置及朝向,并計算相對應的老師及學生的聲源的音量大小,通過聲源位置、聲源朝向、聲源音量大小判斷學生是否在私自講話。
2.如權利要求1所述基于聲音識別的教學考勤方法,其特征在于,步驟七所述判斷學生是否在私自講話的具體方法為:
步驟一、若識別出學生的聲音,則判斷當前時間老師是否在發聲,若老師在發聲,則判斷學生在私自講話,記錄在考勤中;
步驟二、若老師未發聲,讀取前n秒鐘時間點時老師的聲源的位置,根據學生聲源的朝向,判斷學生聲音是否是否朝向老師,若不是朝向老師,則判定學生在課程上私自講話,記錄在考勤系統中;
步驟三、若學生聲源朝向老師,則根據學生與老師位置的距離,判斷聲源音量大小是否在閾值內,若是,則判定學生在回答老師的問題,若不是,則判定學生在私自講話,記錄在考勤系統中。
3.如權利要求1所述基于聲音識別的教學考勤方法,其特征在于,步驟四所述語音的聲紋識別方法如下:
步驟一、把原始語音信號轉化成數字信號,使用一階高通濾波器去除語音信號中多余的噪聲,消除直流漂移,通過加重處理保留對特征參數有用的池音信號;
步驟二、語音信號的處理,取256個點作為一個32ms音框,對每個音框乘以漢明窗,消除音框兩端的不連續性,采用低通濾波器去除噪聲;
步驟三、采用基于似然概率的的加權投票法,根據不同語音幀與概率模型之間的似然概率取值,對每一幀語音進行加權;
步驟四、把不同地區及不同性別的聲音片段映射到多維的特征空間,表征說話人個性特征的向量序列;
步驟五、采用RBM對DNN網絡參數初始化,采用帶有標簽的訓練數據對DNN網絡進行監督的參數更新,在DNN訓練中采用誤差反向傳遞算法巧進行參數訓練;
步驟六、在基于GMM的特征端因子分析中采用DNN替代GMM模型劃分音素特征子空間,實現在每個子空間內對特征進行降維;
步驟七、對每個子空間內降維后的特征端因子與表征說話人個性特征的向量序列分別進行匹配。
4.如權利要求3所述基于聲音識別的教學考勤方法,其特征在于,聲紋識別方法還包括構建不同地區及不同性別的語音信息數據庫,將該語音數據庫中的語音數據信息添加上地理區域信息標簽和性別信息標簽。
5.如權利要求3所述基于聲音識別的教學考勤方法,其特征在于,聲紋識別方法還包括對每個子空間內降維后的特征端因子與帶有地理區域信息標簽和性別信息標簽的表征說話人個性特征的向量序列分別進行匹配;將匹配后的特征端因子添加地理區域信息標簽和性別信息標簽,將DNN網絡中該特征端因子參數更新,以性別信息標簽的數據信息為基準進行聲紋信息的匹配,以地理區域信息標簽的數據信息為基準對匹配信息予以確認。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高艷艷;楊平平;于海波,未經高艷艷;楊平平;于海波許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810608125.0/1.html,轉載請聲明來源鉆瓜專利網。





