[發(fā)明專利]信息處理裝置、信息處理方法和信息處理程序無效
| 申請?zhí)枺?/td> | 201310163614.7 | 申請日: | 2013-05-07 |
| 公開(公告)號: | CN103390404A | 公開(公告)日: | 2013-11-13 |
| 發(fā)明(設計)人: | 山口健;加藤靖彥;木原信之;櫻庭洋平 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/28 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 張貴東 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 程序 | ||
1.一種信息處理裝置,包括:
高質(zhì)量聲音確定部分,配置為確定能夠確定為已經(jīng)在好條件下收集的聲音作為好條件聲音,所述好條件聲音包括在屬于在不同條件下收集的一組聲音的混合聲音中;以及
聲音識別部分,配置為
通過使用預定參數(shù)對由所述高質(zhì)量聲音確定部分確定的所述好條件聲音執(zhí)行聲音識別處理,
基于對所述好條件聲音執(zhí)行的所述聲音識別處理的結(jié)果,修改所述預定參數(shù)的值,并且
通過使用具有所述修改值的所述預定參數(shù),對作為不同于所述好條件聲音的聲音的、包括在所述混合聲音中的聲音執(zhí)行所述聲音識別處理。
2.如權利要求1所述的信息處理裝置,其中所述高質(zhì)量聲音確定部分將所述混合聲音分割為聲音輸出時段,對于每個所述聲音輸出時段計算信噪比,并且基于所述計算的信噪比對于每個所述聲音輸出時段確定所述好條件聲音。
3.如權利要求1所述的信息處理裝置,其中所述高質(zhì)量聲音確定部分將所述混合聲音分割為聲音輸出時段,對于每個所述聲音輸出時段計算信噪比,并且基于所述計算的信噪比對于每個聲音輸出人確定所述好條件聲音。
4.如權利要求1所述的信息處理裝置,其中:
所述混合聲音包括多個聲音,其每個源自由多個音頻編解碼器之一執(zhí)行的處理;并且
在確定所述好條件聲音的處理中,所述高質(zhì)量聲音確定部分在與源自由每個所述其他音頻編解碼器執(zhí)行的所述處理的所述聲音的比較中,確定源自由音頻編解碼器執(zhí)行的處理的聲音為具有高質(zhì)量的聲音。
5.如權利要求1所述的信息處理裝置,其中所述聲音識別部分包括:
特征量提取塊,配置為從包括在所述混合聲音中的處理對象提取特征量;
似然度計算塊,配置為基于由所述特征量提取塊提取的特征量,對于所述處理對象生成聲音識別處理結(jié)果的多個候選者,并且對于每個所述候選者計算似然度;
比較塊,配置為比較每個對于所述候選者之一由所述似然度計算塊計算的每個所述似然度與預定閾值,以便基于所述比較的結(jié)果從所述候選者選擇所述處理對象的聲音識別處理結(jié)果,并且輸出所述選擇的聲音識別處理結(jié)果;以及
參數(shù)修改塊,配置為當已經(jīng)設置所述好條件聲音以用作所述處理對象時,基于由所述比較塊輸出的所述聲音識別處理結(jié)果,修改作為所述預定參數(shù)的在所述特征量提取塊、所述似然度計算塊和所述比較塊的至少一個中使用的參數(shù)。
6.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改在似然度的計算中由所述似然度計算塊使用的先驗概率,作為包括在所述好條件聲音的聲音識別處理結(jié)果中的包括詞的候選者的所述預定參數(shù)。
7.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改在所述比較塊中使用的所述閾值,作為所述預定參數(shù)。
8.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改在似然度的計算中由所述似然度計算塊使用的先驗概率,作為包括在所述好條件聲音的聲音識別處理結(jié)果中的包括詞的相關詞的候選者的所述預定參數(shù)。
9.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改在所述特征量提取塊中采用來提取特征量的頻率分析技術,作為所述預定參數(shù)。
10.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改由所述特征量提取塊提取的特征量的類型,作為所述預定參數(shù)。
11.如權利要求5所述的信息處理裝置,其中如果已經(jīng)設置不同于所述好條件聲音的聲音以用作所述處理對象,則所述參數(shù)修改塊修改在所述似然度計算塊中使用的候選者的數(shù)目,作為所述預定參數(shù)。
12.如權利要求5所述的信息處理裝置,其中所述參數(shù)修改塊設置所述好條件聲音前后預定數(shù)目的時間單元,以用作所述預定參數(shù)的修改時間范圍,并且對于在包括在所述修改時間范圍中的時間輸出的聲音統(tǒng)一地修改所述預定參數(shù)的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310163614.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





