[發(fā)明專利]聲音識別結(jié)果檢驗方法和設(shè)備、聲音識別及音頻監(jiān)視系統(tǒng)有效

申請?zhí)枺?/td>	201210092352.5	申請日：	2012-03-31
公開（公告）號：	CN103366734A	公開（公告）日：	2013-10-23
發(fā)明（設(shè)計）人：	郭莉莉;沈海峰	申請（專利權(quán)）人：	佳能株式會社
主分類號：	G10L15/00	分類號：	G10L15/00;G10L25/78
代理公司：	中國國際貿(mào)易促進委員會專利商標事務(wù)所 11038	代理人：	歐陽帆
地址：	日本***	國省代碼：	日本;JP
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	聲音識別結(jié)果檢驗方法設(shè)備音頻監(jiān)視系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及用于檢驗聲音識別結(jié)果的方法和設(shè)備、聲音識別系統(tǒng)和用于自動檢測異常音頻事件的音頻監(jiān)視系統(tǒng)。

背景技術(shù)

置信度(Confidence?Measure，CM)技術(shù)通常被用于減少聲音識別過程中的誤警(false?alarm)。更具體而言，在獲得聲音識別結(jié)果之后，基于該聲音識別結(jié)果來計算置信度。然后，將置信度與預(yù)定的閾值進行比較，從而檢驗該聲音識別結(jié)果。置信度是用于評估聲音識別結(jié)果的可靠性的分數(shù)。在許多實際的應(yīng)用中，優(yōu)良的置信度可以較大程度地有益于聲音識別過程。

一般，聲音識別結(jié)果以N個最好的(N-best)列表的形式輸出，該N-best列表由被排序的N個最好的候選聲音以及它們的識別分數(shù)構(gòu)成，如下面的表1中示例性地示出的。

表1N-best列表

?ID??聲音??識別分數(shù)?候選1??尖叫聲??0.59?候選2??槍擊聲??0.42?候選3??CS-1??0.35?候選4??玻璃破碎聲??0.32?候選5??CS-2??0.26?…??…??…

在現(xiàn)有技術(shù)中，已經(jīng)提出了基于置信度的不同的計算方法來檢驗具有N-best列表形式的聲音識別結(jié)果的各種方法。

例如，美國專利No.6125345(在下文中被稱為“現(xiàn)有技術(shù)1”)公開了一種用于檢驗聲音識別結(jié)果的方法，在該方法中，計算置信度的過程包括以下兩個步驟。也就是說，在步驟1中，獲得N-best列表中的第一候選聲音的識別分數(shù)S1和第二候選聲音的識別分數(shù)S2。第一候選聲音在N-best列表中具有最高的識別分數(shù)，并且第二候選聲音在N-best列表中具有第二高的識別分數(shù)。然后，在步驟2中，計算上述兩個識別分數(shù)之間的差作為置信度，如公式(1)所示。

CM＝S1-S2????(1)

另外，美國專利申請公開No.2009/0006102(在下文中被稱為“現(xiàn)有技術(shù)2”)也公開了一種用于檢驗聲音識別結(jié)果的方法，在該方法中，計算置信度的過程包括以下三個步驟。也就是說，在步驟1中，獲得N-best列表中的第一候選聲音和第二候選聲音以及它們的識別分數(shù)S1和S2。

然后，在步驟2中，計算與第一候選聲音對應(yīng)的分類模型和與第二候選聲音對應(yīng)的分類模型之間的距離D。分類模型由一個或多個高斯混合組成。距離測度(distance?measure)是基于第一候選聲音和第二候選聲音的兩個分類模型的混合之間的馬氏距離(Mahalanobis距離)的加權(quán)和。

然后，在步驟3中，計算上述兩個識別分數(shù)之間的差除以距離D的對數(shù)，以作為置信度，如公式(2)所示。

CM＝log[1000＊(S1-S2)/D]????(2)

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佳能株式會社，未經(jīng)佳能株式會社許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210092352.5/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：圖像形成設(shè)備
下一篇：直聯(lián)離心壓縮機用懸臂式電機轉(zhuǎn)子及直聯(lián)式離心壓縮機

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】