[發明專利]用于校正語音的設備和方法無效
| 申請號: | 201210305970.3 | 申請日: | 2012-08-24 |
| 公開(公告)號: | CN103259979A | 公開(公告)日: | 2013-08-21 |
| 發明(設計)人: | 井本和范;廣畑誠 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | H04N5/262 | 分類號: | H04N5/262 |
| 代理公司: | 上海市華誠律師事務所 31210 | 代理人: | 楊暄 |
| 地址: | 日本東京都*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 校正 語音 設備 方法 | ||
1.一種用于校正與移動圖像相對應的語音的設備,其特征在于,包括:
分離單元,被配置為從所述語音的每個音頻幀中分離至少一個音頻成分;
推測單元,被配置為基于所述移動圖像的每個圖像幀的特征和所述每個音頻幀的特征中的至少一個特征,在所述移動圖像中推測包括關聯的多個圖像幀的場景;
分析單元,被配置為通過分析所述每個圖像幀來獲取所述多個圖像幀的屬性信息;以及
校正單元,被配置為基于所述屬性信息來確定與所述多個圖像幀相對應的所述音頻成分的校正方法,并且通過所述校正方法校正所述音頻成分。
2.如權利要求1所述的設備,其特征在于,
所述推測單元基于所述每個圖像幀的所述特征,檢測所述移動圖像中的每個切割邊界,并且基于包含在切割邊界和剛剛在所述切割邊界之前檢測到的另一個切割邊界之間的圖像幀的所述特征,推測所述場景。
3.如權利要求2所述的設備,其特征在于,
所述分析單元獲取所述屬性信息,所述屬性信息表示所述每個圖像幀是否包括至少一個人區域,以及
所述校正單元將所述多個圖像幀中包括所述人區域的圖像幀的數量與不包括所述人區域的圖像幀的數量進行比較,并且基于比較結果來確定所述校正方法。
4.如權利要求3所述的設備,其特征在于,
所述校正單元通過與所述比較結果中較多數量的圖像幀相對應的所述校正方法來校正所述音頻成分。
5.如權利要求1所述的設備,其特征在于,
所述推測單元對包含在所述每個音頻幀中的所述音頻成分的類型進行聚類,并且基于所述類型推測所述場景。
6.如權利要求1所述的設備,其特征在于,
所述推測單元通過判定是否從所述每個音頻幀中檢測到特定聲音來推測所述場景。
7.一種用于校正與移動圖像相對應的語音的方法,其特征在于,包括:
從所述語音的每個音頻幀中分離至少一個音頻成分;
基于所述移動圖像的每個圖像幀的特征和所述每個音頻幀的特征中的至少一個特征,在所述移動圖像中推測包括關聯的多個圖像幀的場景;
通過分析所述每個圖像幀來獲取所述多個圖像幀的屬性信息;
基于所述屬性信息,確定與所述多個圖像幀相對應的所述音頻成分的校正方法;以及通過所述校正方法來校正所述音頻成分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210305970.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種被動自適應履帶可變形移動機器人平臺
- 下一篇:一種可變剛度的柔性機械手





