[發明專利]基于i-vector局部加權的光纖振動振源識別分類方法及系統在審
| 申請號: | 201810424808.0 | 申請日: | 2018-05-07 |
| 公開(公告)號: | CN110458179A | 公開(公告)日: | 2019-11-15 |
| 發明(設計)人: | 劉本剛;張潔;鄧子璇;顧宗隨;柴軍杰;魏嘉 | 申請(專利權)人: | 光子瑞利科技(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100000北京市豐臺區南四環西路*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 光纖振動 振源 可用性 分辨能力 加權線性 判別分析 聲紋識別 信道差異 信道環境 振源識別 魯棒性 識別率 振動源 預警系統 權重 散度 虛警 加權 樣本 | ||
本發明公開了一種基于i?vector局部加權的光纖振動振源識別方法及系統。針對現有光纖振動預警系統中識別率低造成虛警較多,可用性差的問題,本發明提出基于i?vector局部加權線性判別分析的振源聲紋識別方法,在計算類內和類間散度時,增加待識別振動源近鄰樣本權重。在此基礎上,通過提高待識別振源近鄰域局部類間的分辨能力,減少因信道差異而產生的識別錯誤,從而在復雜信道環境下能夠保持良好的魯棒性。
技術領域
本發明涉及光纖聽音、安防領域,特別是涉及基于i-vector局部加權的光纖振動振源識別分類方法及系統。
背景技術
光纖振動傳感器作為一種新型的振動采集傳感器,可以實現長距離無緣探測,微小的擾動就可以使光纖由于振動而變形,傳輸軌跡也會相應變化。具有抗電磁和射頻干擾、靈敏度高、安全可靠和保密性強等優點,特別適用于強電磁場、高射頻、易燃易爆和軍事安全等場合。但光纖振動對信號過于靈敏也造成誤報率高,現多采用門限的方式來過濾虛警。
目前門限上的處理設計思路主要是提取出信號的幅度特性,該幅度特性也包括雜波和噪聲幅度變化,將提取到的幅度特性與門限比較,將高于門限的信號提取后報警。而門限值不能很好的反應光的振動情況。當光路及外部環境發生變化的時候無法進行自適應調整,因而可用性極差。而本發明利用光纖采集的振動數據可還原為音頻,繼而采用基于語音模式識別分類的方法進行,因此研究基于i-vector局部加權的光纖振動振源識別方法具有非常重要的理論價值和實際應用意義。
發明內容
本發明主要解決的技術問題是提供一種基于i-vector局部加權的反饋式光纖振動振源分類的方法及裝置。由于光纖中瑞利散射的反饋光的反射強度調制,聲紋識別系統通常采用線性鑒別分析(LDA)來消除訓練和測試振源音頻之間信道失配,不能保證樣本在待識別振源近鄰區域內具有最佳的分離度,這就使得在光纖振動系統中目標振源和其近鄰間的得分差異較小,進而導致識別準確性下降。而近年來為了提高在信道失配條件下的識別魯棒性,進一步提出了SN-LDA(source normalised linear discriminant analysis)、WLDA(weighted linear discriminant analysis),方法在計算類內和類間散度矩陣時,對所有的訓練樣本賦予相同的權重,然后求解出的投影矩陣可以最大化所有樣本的平均類間散度和最小化平均類內散度。然而,這些方法沒有很好地突出待識別振源音頻近鄰區域的局部分離度。
為解決上述技術問題,更好的對目標振源進行識別分類,針對該問題本發明提出的一個技術方案是基于i-vector局部加權線性判別分析的目標振源識別方法(LWLDA)。在計算類內和類間散度時,增加待識別振源近鄰樣本權重。在此基礎上,通過提高待識別振源近鄰域局部類間的分辨能力,盡可能減少因信道差異而產生的識別錯誤。
其中,所述基于i-vector局部加權線性判別分析的算法設計的步驟包括:線性判別分析與信道失配補償。首先,本發明為了使目標振源所有信道條件下的聲紋特征更加緊湊,引入了T子空間的概念。把振源音頻的差異性用單一的更低維的T空間和殘差來表示。對于一段振源音頻,在T子空間里,超UBM均值向量可以表示為:
M=m+Tx+ε (1)
式(1)中,m為一個與特定目標振源和信道都無關的超向量,即由大量通用背景振源音頻訓練的UBM均值向量,代表所有人在所有信道條件下的超均值向量的平均值。T為T子空間矩陣,x為目標振源因子,其分布服從正態分布N(0,I),ε為殘差,可視作噪聲。M服從均值為m、協方差矩陣為TTT的正態分布。T子空間矩陣T可在訓練集目標振源語音樣本上由Map(maximumaposterior)算法生成,T子空間變化因子屬于隱變量。在給定目標振源s第h段語音的特征和T子空間參數集的條件下,將i-vector記作us,h,將該段語音的0階和1階Baum-Welch統計量記為N(s,h)與F'(s,h),訓練時的方差記為Σ,具體如式(2):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于光子瑞利科技(北京)有限公司,未經光子瑞利科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810424808.0/2.html,轉載請聲明來源鉆瓜專利網。





