[發(fā)明專利]聲音識別結(jié)果檢驗方法和設(shè)備、聲音識別及音頻監(jiān)視系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210092352.5 | 申請日: | 2012-03-31 |
| 公開(公告)號: | CN103366734A | 公開(公告)日: | 2013-10-23 |
| 發(fā)明(設(shè)計)人: | 郭莉莉;沈海峰 | 申請(專利權(quán))人: | 佳能株式會社 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L25/78 |
| 代理公司: | 中國國際貿(mào)易促進委員會專利商標事務(wù)所 11038 | 代理人: | 歐陽帆 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲音 識別 結(jié)果 檢驗 方法 設(shè)備 音頻 監(jiān)視 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及用于檢驗聲音識別結(jié)果的方法和設(shè)備、聲音識別系統(tǒng)和用于自動檢測異常音頻事件的音頻監(jiān)視系統(tǒng)。
背景技術(shù)
置信度(Confidence?Measure,CM)技術(shù)通常被用于減少聲音識別過程中的誤警(false?alarm)。更具體而言,在獲得聲音識別結(jié)果之后,基于該聲音識別結(jié)果來計算置信度。然后,將置信度與預(yù)定的閾值進行比較,從而檢驗該聲音識別結(jié)果。置信度是用于評估聲音識別結(jié)果的可靠性的分數(shù)。在許多實際的應(yīng)用中,優(yōu)良的置信度可以較大程度地有益于聲音識別過程。
一般,聲音識別結(jié)果以N個最好的(N-best)列表的形式輸出,該N-best列表由被排序的N個最好的候選聲音以及它們的識別分數(shù)構(gòu)成,如下面的表1中示例性地示出的。
表1N-best列表
在現(xiàn)有技術(shù)中,已經(jīng)提出了基于置信度的不同的計算方法來檢驗具有N-best列表形式的聲音識別結(jié)果的各種方法。
例如,美國專利No.6125345(在下文中被稱為“現(xiàn)有技術(shù)1”)公開了一種用于檢驗聲音識別結(jié)果的方法,在該方法中,計算置信度的過程包括以下兩個步驟。也就是說,在步驟1中,獲得N-best列表中的第一候選聲音的識別分數(shù)S1和第二候選聲音的識別分數(shù)S2。第一候選聲音在N-best列表中具有最高的識別分數(shù),并且第二候選聲音在N-best列表中具有第二高的識別分數(shù)。然后,在步驟2中,計算上述兩個識別分數(shù)之間的差作為置信度,如公式(1)所示。
CM=S1-S2????(1)
另外,美國專利申請公開No.2009/0006102(在下文中被稱為“現(xiàn)有技術(shù)2”)也公開了一種用于檢驗聲音識別結(jié)果的方法,在該方法中,計算置信度的過程包括以下三個步驟。也就是說,在步驟1中,獲得N-best列表中的第一候選聲音和第二候選聲音以及它們的識別分數(shù)S1和S2。
然后,在步驟2中,計算與第一候選聲音對應(yīng)的分類模型和與第二候選聲音對應(yīng)的分類模型之間的距離D。分類模型由一個或多個高斯混合組成。距離測度(distance?measure)是基于第一候選聲音和第二候選聲音的兩個分類模型的混合之間的馬氏距離(Mahalanobis距離)的加權(quán)和。
然后,在步驟3中,計算上述兩個識別分數(shù)之間的差除以距離D的對數(shù),以作為置信度,如公式(2)所示。
CM=log[1000*(S1-S2)/D]????(2)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佳能株式會社,未經(jīng)佳能株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210092352.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





