[發明專利]語音處理裝置及語音處理方法在審
| 申請號: | 201410211542.3 | 申請日: | 2014-05-19 |
| 公開(公告)號: | CN104183246A | 公開(公告)日: | 2014-12-03 |
| 發明(設計)人: | 鹽田千里;外川太郎;大谷猛 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L21/01 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱勝;李春暉 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 裝置 方法 | ||
技術領域
本文中所討論的實施方式涉及一種控制例如輸入信號的語音處理裝置、語音處理方法以及語音處理程序。
背景技術
響應于信息處理設備開發和國際化的最新進展,存在越來越多的機會來觀看和收聽第二語言的內容以及通過個人計算機中所安裝的電話呼叫應用來以第二語言進行呼叫。在這些情況下,公開了通過其來控制第二語言的語音信號(輸入信號的示例)使得語音信號易于收聽的方法。在例如日本特許公開公報第10-133678號中,公開了一種通過從語音信號提取聲音時段并將無聲時段加至聲音時段的后端來使得輸入語音易于理解的技術。已知用戶通常進行重復性無聲語,在該重復性無聲語中,用戶通過無可聽得見的發音的內部講話回讀用戶所聽到的難以理解的第二語言的詞(例如參見Sinozuka?Katsumasa,Listening?Power?in?Second?language?and?Working?Memorytransactions?No.40,2008at?Department?of?English?literature,Graduate?School?of?Literature,Seijo?University)。因此,為了理解第二語言,重要的是確保用于重復性無聲語的無聲時段。
當加入無聲時段以理解輸入語音時,語音處理被延遲。如果例如用戶觀看和收聽內容,則視覺/音頻時間被延長。當用戶進行呼叫時,出現了另外的問題:由于語音處理被延遲,因此以正常速度進行對話變得困難。因此,當確保用于重復性無聲語的無聲時段時,期望的是抑制語音處理的延遲。然而,由于在無聲時段的長度與語音處理被延遲的量之間存在比例關系,因此還未提出一種抑制語音處理的延遲的語音處理裝置。鑒于上述情況,本發明的目的是提供一種可以抑制語音處理的延遲并且還可以改進用戶對輸入語音的理解的語音處理裝置。
發明內容
根據實施方式的一個方面,語音處理裝置包括處理器,該裝置包括:獲取單元,該獲取單元被配置成獲取輸入語音;檢測單元,該檢測單元被配置成檢測輸入語音中所包括的聲音時段和與聲音時段的后端相鄰的無聲時段;計算單元,該計算單元被配置成計算聲音時段中所包括的詞的數量;以及控制單元,該控制單元被配置成根據詞的數量來控制無聲時段的長度。
將借助于權利要求中具體指出的要素和組合來實現和獲得本發明的目的和優點。
將理解,如所要求保護的,前述的一般描述和下面的詳細描述兩者均是示例性的和說明性的,并且不是對本發明的限制。
本公開內容中的語音處理裝置可以抑制語音處理的延遲,并且還可以改進用戶對輸入語音的理解。
附圖說明
根據以下結合附圖進行的對實施方式的描述,這些和/或其他方面和優點將變得明顯且更易于理解,在附圖中:
圖1是第一實施方式中的語音處理裝置的功能框圖;
圖2是實施方式中的檢測單元的功能框圖;
圖3示出了由檢測單元檢測的聲音時段和無聲時段;
圖4示出了作為聲學特征的示例的音拍(mora)的數量與詞的數量之間的關系;
圖5示出了聲音時段中所包括的詞的數量與用于理解的無聲時段的長度之間的關系;
圖6是由語音處理裝置執行的語音處理的流程圖;
圖7示出了輸入語音功率與所提取的功率突變的數量之間的關系;
圖8示出了作為聲學特征的示例的功率突變的數量與詞的數量之間的關系;
圖9是第二實施方式中的語音處理裝置的功能框圖;
圖10是第三實施方式中的語音處理裝置的功能框圖;
圖11是實施方式中的用作語音處理裝置的計算機的硬件結構;以及
圖12是實施方式中的移動終端裝置的硬件結構。
具體實施方式
將參照附圖來描述實施方式中的語音處理裝置、語音處理方法以及語音處理程序的示例。這些示例不限制所公開的技術。
(第一實施方式)
圖1是第一實施方式中的語音處理裝置1的功能框圖。語音處理裝置1包括獲取單元2、檢測單元3、提取單元4、計算單元5以及控制單元6。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社;,未經富士通株式會社;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410211542.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻播放方法及裝置
- 下一篇:用于便攜式終端的語音處理方法及裝置





