[發明專利]信息處理裝置、信息處理方法和信息處理程序無效
| 申請號: | 201310163614.7 | 申請日: | 2013-05-07 |
| 公開(公告)號: | CN103390404A | 公開(公告)日: | 2013-11-13 |
| 發明(設計)人: | 山口健;加藤靖彥;木原信之;櫻庭洋平 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/28 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 張貴東 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 程序 | ||
技術領域
一般地,本技術涉及信息處理裝置、信息處理方法和信息處理程序。更具體地,本技術涉及能夠改進不同聲音收集條件下收集的一組聲音的聲音識別精度的信息處理裝置、涉及為該信息處理裝置提供的信息處理方法、并且涉及實施該信息處理方法的信息處理程序。
背景技術
在過去,通過利用聲音記錄器等記錄由會議室中的會議參加者輸出的聲音,并且此外在編碼和解碼之后由參加者發送和接收由TV(電視)會議參加者輸出的聲音。因此,在這樣的會議中,存在下文中也被稱為聲音收集系統的聲音記錄系統。作為用于應用聲音識別技術到這樣的聲音收集系統的現有技術,提供了一種用于自動創建會議紀要的技術以及一種用于檢測不當表述以便避免發送該表述的聲音的技術。對于關于用于自動創建會議紀要的技術的更多信息,參見日本專利公開No.2004-287201和2003-255979(下文中分別稱為專利文獻1和2)。另一方面,對于關于用于檢測不當表述的技術的更多信息,參見日本專利公開No.2011-205243(下文中稱為專利文獻3)。
發明內容
然而,當通過利用聲音記錄器等記錄由會議室中的多個會議參加者輸出的聲音時,在許多情況下聲音通常通過不同距離從參加者傳播到記錄器的擴音器。此外,在一些情況下,用于在任何特定會議室中的TV會議參加者輸出的聲音的編碼和解碼的音頻編解碼器,不同于用于在TV會議中連接到該特定會議室的另一會議室中的TV會議參加者輸出的聲音的編碼和解碼的音頻編解碼器。如上所述,在許多情況下,聲音收集系統具有不同的聲音收集條件。
在包括專利文獻1到3中公開的那些的現有技術的聲音識別技術中,對于在不同聲音收集條件下收集的一組聲音,以單個統一方式執行聲音識別處理。在此情況下,在好條件下收集的一組聲音可以用高精度識別。然而,擔心在一些情況下其他聲音不能用高精度識別。
因此,希望本技術解決上述問題,以便改進對于在不同聲音收集條件下收集的一組聲音的聲音識別精度。
根據本技術實施例的一種信息處理裝置,包括:
高質量聲音確定部分,配置為確定能夠確定為已經在好條件下收集的聲音作為好條件聲音,好條件聲音包括在屬于在不同條件下收集的一組聲音的混合聲音中;以及
聲音識別部分,配置為
通過使用預定參數對由高質量聲音確定部分確定的好條件聲音執行聲音識別處理,
基于對好條件聲音執行的聲音識別處理的結果,修改預定參數的值,并且
通過使用具有修改值的預定參數,對作為不同于好條件聲音的聲音的、包括在混合聲音中的聲音執行聲音識別處理。
高質量聲音確定部分能夠將混合聲音分割為聲音輸出時段,對于每個聲音輸出時段計算S/N比,并且基于計算的S/N比對于每個聲音輸出時段確定好條件聲音。
高質量聲音確定部分能夠將混合聲音分割為聲音輸出時段,對于每個聲音輸出時段計算S/N比,并且基于計算的S/N比對于每個聲音輸出人確定好條件聲音。
混合聲音包括多個聲音,其每個源自由多個音頻編解碼器之一執行的處理;并且在確定好條件聲音的處理中,高質量聲音確定部分能夠在與源自由每個其他音頻編解碼器執行的處理的聲音的比較中,確定源自由音頻編解碼器執行的處理的聲音為具有高質量的聲音。
聲音識別部分包括:
特征量提取塊,配置為從包括在混合聲音中的處理對象提取特征量;
似然度計算塊,配置為基于由特征量提取塊提取的特征量,對于處理對象生成聲音識別處理結果的多個候選者,并且對于每個候選者計算似然度;
比較塊,配置為比較每個對于候選者之一由似然度計算塊計算的每個似然度與預定閾值,以便基于比較的結果從候選者選擇處理對象的聲音識別處理結果,并且輸出選擇的聲音識別處理結果;以及
參數修改塊,配置為當已經設置好條件聲音以用作處理對象時,基于由比較塊輸出的聲音識別處理結果,修改作為預定參數在特征量提取塊、似然度計算塊和比較塊的至少一個中使用的參數。
如果已經設置不同于好條件聲音的聲音以用作處理對象,則參數修改塊能夠修改在似然度的計算中由似然度計算塊使用的先驗概率,作為包括在好條件聲音的聲音識別處理結果中的包括詞的候選者的預定參數。
如果已經設置不同于好條件聲音的聲音以用作處理對象,則參數修改塊能夠修改在比較塊中使用的閾值,作為預定參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310163614.7/2.html,轉載請聲明來源鉆瓜專利網。





