[發明專利]模型生成裝置、模式識別設備及其方法有效
| 申請號: | 201310064923.9 | 申請日: | 2013-03-01 |
| 公開(公告)號: | CN104021390B | 公開(公告)日: | 2018-01-02 |
| 發明(設計)人: | 沈海峰;趙元;陶訓強;山本寬樹 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所11038 | 代理人: | 羅銀燕 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 生成 裝置 模式識別 設備 及其 方法 | ||
技術領域
本發明涉及模式識別領域,尤其涉及用于模式識別的模型生成裝置、模式識別設備及其方法。
背景技術
迄今,模式識別技術已得到迅速的發展,并已被廣泛地用于進行手勢識別、手寫字符識別、語音識別、說話者識別等。
在模式識別領域中,模型生成方法對于所需的存儲器大小以及模式識別性能具有重要的影響。
通常的模型生成方法并不具有任何方差共享機制。圖1示意性地示出這種無方差共享的方法。這里,出于簡化的目的,假設每個模型除兩個虛狀態之外具有兩個實狀態(實狀態是指既具有轉移概率又具有輸出概率的狀態,而虛狀態是指僅具有轉移概率而不具有輸出概率的狀態)。此外,假設每個實狀態具有兩個混合分量,而每個混合分量例如是多維高斯分布。在圖中,在每個高斯分布的下方都以雙箭頭的形式示出了該高斯分布的方差,雙箭頭的長短對應于方差值的大小。如圖1所示,在模型1中,實狀態1的混合分量的方差依次為 V1和V2,實狀態2的混合分量的方差依次為V3和V4;而在模型2 中,實狀態1的混合分量的方差依次為V5和V6,實狀態2的混合分量的方差依次為V7和V8。在圖1所示的無方差共享方法中,方差V1~V8的值可能是不同的。
出于諸如減小存儲器大小或獲得良好的模型參數估計等的目的,在模型生成過程中可以使用方差共享方法。
US2005/0192806A1公開了全局固定(Grand-fixed)方差共享方法。根據該方法,通過對多個概率密度函數的方差進行平均化而獲得一個全局方差。圖2示意性地示出全局固定方差共享方法。如圖2 所示,各模型的各實狀態中的各混合分量的方差都相同,即,都為V。
另外,文獻Wei-Qiang Zhang and Jia Liu(2011),‘Discriminative Universal Background Model Training for Speaker Recognition’, Speech and Language Technologies,Prof.Ivo Ipsic(Ed.),ISBN: 978-953-307-322-4,InTech公開了通用背景模型(Universal Background Model,UBM)方差共享方法。根據該方法,對UBM進行訓練,并且所有的目標說話者模型共享該UBM中的方差。圖3示意性地示出UBM方差共享方法。如圖3所示,各模型中具有相同狀態標號的狀態共享相同的方差。更具體而言,對于模型1的實狀態1 與模型2的實狀態1而言,其混合分量的方差共享,即,模型1的實狀態1中的混合分量的方差依次為V1和V2,而模型2的實狀態1 中的混合分量的方差也依次為V1和V2。并且,對于模型1的實狀態2與模型2的實狀態2而言,其混合分量的方差共享,即模型1 的實狀態2中的混合分量的方差依次為V3和V4,而模型2的實狀態2中的混合分量的方差也依次為V3和V4。
然而,上述文獻中的方法各自存在限制。
在US2005/0192806A1公開的全局固定方差共享方法中,由于僅使用一個全局固定方差,因此方差的分辨率通常并不太好。鑒于此,補償因子被采用。但是,由于在解碼過程中會頻繁地調用高斯概率計算處理,使得該過程由于用于處理補償因子的額外的乘運算或除運算而產生太大的計算量。此外,還需要有額外的存儲器來存儲補償因子。
另外,在Wei-Qiang Zhang等人公開的UBM方差共享方法中,由于所有目標模型具有與UBM相同的狀態拓撲,因此其難以應對目標模型具有不同的狀態數或具有不同的每一狀態的混合分量數的情況。此外,在有限訓練數據的情況下,該方法有可能由于需要估計較多的方差而不能提供良好的模型參數估計。
因此,希望能夠提供一種新的用于模式識別的模型生成裝置、模式識別設備及其方法。
發明內容
鑒于以上問題中的至少一個提出本發明。
本發明的一個目的是提供一種新的用于模式識別的模型生成裝置、模式識別設備及其方法。
本發明的另一目的是提供一種用于模式識別的模型生成裝置、模式識別設備及其方法,其至少能夠適當地減少模型參數的數目,從而適當地減小存儲器大小。
本發明的又一目的是提供一種用于模式識別的模型生成裝置、模式識別設備及其方法,其至少能夠在有限訓練數據的情況下提供較好的模型參數估計,從而提供較好的識別性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310064923.9/2.html,轉載請聲明來源鉆瓜專利網。





