[發明專利]語音處理裝置及語音處理方法在審
| 申請號: | 201410211542.3 | 申請日: | 2014-05-19 |
| 公開(公告)號: | CN104183246A | 公開(公告)日: | 2014-12-03 |
| 發明(設計)人: | 鹽田千里;外川太郎;大谷猛 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L21/01 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱勝;李春暉 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 裝置 方法 | ||
1.一種語音處理裝置,包括處理器,所述裝置包括:
獲取單元,所述獲取單元被配置成獲取輸入語音;
檢測單元,所述檢測單元被配置成檢測所述輸入語音中所包括的聲音時段和與所述聲音時段的后端相鄰的無聲時段;
計算單元,所述計算單元被配置成計算所述聲音時段中所包括的詞的數量;以及
控制單元,所述控制單元被配置成根據詞的數量來控制所述無聲時段的長度。
2.根據權利要求1所述的裝置,還包括:
存儲單元,所述存儲單元被配置成存儲根據用戶的特征的屬性信息;
其中,所述獲取單元還獲取所述屬性信息,并且
其中,所述控制單元根據詞的數量和所述屬性信息來控制所述無聲時段的長度。
3.根據權利要求2所述的裝置,
其中,所述屬性信息為以下中至少之一:用戶的語言技能測試得分、用戶學習語言的時間長度、用戶的年齡和用戶響應語音所花費的時間。
4.根據權利要求3所述的裝置,
其中,所述獲取單元還獲取從所述用戶輸入的響應,
其中,用戶響應語音所花費的時間是從所述聲音時段終止到所述用戶輸入響應的時間。
5.根據權利要求1所述的裝置,還包括:
提取單元,所述提取單元被配置成提取所述聲音時段中所包括的聲學特征;
其中,所述計算單元根據所述聲學特征來計算所述聲音時段中所包括的詞的數量。
6.根據權利要求5所述的裝置,
其中,所述聲學特征為以下之一:所述聲音時段中所包括的音拍的數量;以及所述聲音時段中所包括的功率突變的數量。
7.根據權利要求1所述的裝置,
其中,所述檢測單元根據所述輸入語音中所包括的多個幀來檢測信號功率與噪聲之比,
其中,所述檢測單元將所述信號功率與噪聲之比等于或大于第一閾值的幀檢測為所述聲音時段,
其中,所述檢測單元將所述信號功率與噪聲之比小于所述第一閾值的幀檢測為所述無聲時段。
8.根據權利要求1所述的裝置,
其中,所述控制單元控制所述無聲時段,其中,詞的數量越大,所述無聲時段就越長,以及其中,詞的數量越小,所述無聲時段就越短。
9.根據權利要求1所述的裝置,
其中,所述獲取單元獲取包括預定數量的詞的語音作為所述輸入語音。
10.根據權利要求1所述的裝置,還包括:
識別單元,所述識別單元被配置成將所述輸入語音識別為文本信息;
其中,所述計算單元根據所述文本信息來計算詞的數量。
11.一種語音處理方法,包括:
獲取輸入語音;
檢測所述輸入語音中所包括的聲音時段和與所述聲音時段的后端相鄰的無聲時段;
計算所述聲音時段中所包括的詞的數量;以及
根據詞的數量來控制所述無聲時段的長度。
12.根據權利要求11所述的方法,還包括:
存儲根據用戶的特征的屬性信息;
其中,所述獲取為獲取所述屬性信息,
其中,所述控制為根據所述屬性信息和詞的數量來控制所述無聲時段的長度。
13.根據權利要求12所述的方法,
其中,所述屬性信息為以下中至少之一:用戶的語言技能測試得分、用戶學習語言的時間長度、用戶的年齡和用戶響應語音所花費的時間。
14.根據權利要求13所述的方法,
其中,所述獲取為進一步獲取從所述用戶輸入的響應,
其中,用戶響應語音所花費的時間是從所述聲音時段終止到所述用戶輸入響應的時間。
15.根據權利要求14所述的方法,還包括:
提取所述聲音時段中所包括的聲學特征;
其中,所述計算為根據所述聲學特征來計算所述聲音時段中所包括的詞的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社;,未經富士通株式會社;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410211542.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻播放方法及裝置
- 下一篇:用于便攜式終端的語音處理方法及裝置





