[發(fā)明專利]用于校正語音的設備和方法無效
| 申請?zhí)枺?/td> | 201210305970.3 | 申請日: | 2012-08-24 |
| 公開(公告)號: | CN103259979A | 公開(公告)日: | 2013-08-21 |
| 發(fā)明(設計)人: | 井本和范;廣畑誠 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | H04N5/262 | 分類號: | H04N5/262 |
| 代理公司: | 上海市華誠律師事務所 31210 | 代理人: | 楊暄 |
| 地址: | 日本東京都*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 校正 語音 設備 方法 | ||
技術領域
在此描述的實施例大體涉及用于校正與移動圖像相對應的語音的設備和方法。
背景技術
關于利用移動圖像再生的語音,通過分析該移動圖像,存在有用于基于分析結果校正語音的設備。
在傳統(tǒng)的音頻校正設備的技術中,通過檢測移動圖像中出現(xiàn)的人數(shù),基于該人數(shù),強調(diào)該語音或者控制它的方向性。
在另一個傳統(tǒng)的音頻校正設備的技術中,基于移動圖像中出現(xiàn)的物體的位置或者使該物體成像的攝像機的移動狀態(tài),輸出該語音以使物體的嗓音(或者聲音)從物體的位置被發(fā)出。
然而,在這個音頻校正設備中,對于移動圖像的每個幀,單獨校正該語音。因此,在一系列的場景中,關于不包括實際上發(fā)聲的物體(人,動物、機動車等等)的幀,校正它的語音。
結果,在一系列的場景中,當包括物體實際上發(fā)聲的幀和不包括該物體的另一個幀混合時,輸出觀眾難以聽見的語音。
發(fā)明內(nèi)容
實施例提供了一種用于將與移動圖像相對應的語音校正為觀眾容易聽見的語音的設備和方法。
根據(jù)一個實施例,校正與移動圖像相對應的語音的設備包括分離單元、推測單元、分析單元和校正單元。分離單元被配置為從所述語音的每個音頻幀中分離至少一個音頻成分。推測單元被配置為基于所述移動圖像的每個圖像幀的特征和所述每個音頻幀的特征中的至少一個特征,在所述移動圖像中推測包括關聯(lián)的多個圖像幀的場景。分析單元被配置為通過分析所述每個圖像幀來獲取所述多個圖像幀的屬性信息。校正單元被配置為基于所述屬性信息來確定與所述多個圖像幀相對應的所述音頻成分的校正方法,并且通過所述校正方法來校正所述音頻成分。
根據(jù)實施例,可以提供一種將與移動圖像相對應的語音校正為觀眾容易聽見的語音的設備和方法。
附圖說明
圖1是根據(jù)第一實施例的音頻校正設備1的方框圖。
圖2是音頻校正設備1的處理的流程圖。
圖3是適合于音頻校正設備1處理的移動圖像的一個實例。
圖4是圖1中的分離單元20的處理的流程圖。
圖5是圖1中的推測單元30的處理的流程圖。
圖6是解釋類似鏡頭(shot)的示意圖。
圖7是圖1中的分析單元40的處理的流程圖。
圖8是圖1中的校正單元50的處理的流程圖。
圖9是根據(jù)第二實施例的音頻校正設備2的方框圖。
圖10是適合于音頻校正設備2處理的移動圖像的一個實例。
圖11是圖9中的推測單元31的處理的流程圖。
圖12是圖9中的校正單元51的處理的流程圖。
圖13是適合于音頻校正設備3處理的移動圖像的一個實例。
圖14是根據(jù)第三實施例的音頻校正設備3的方框圖。
圖15是圖14中的分離單元22的處理的流程圖。
圖16是圖14中的推測單元32的處理的流程圖。
圖17是圖14中的分析單元52的處理的流程圖。
圖18是圖14中的校正單元52的處理的流程圖。
圖19是根據(jù)第四實施例的音頻校正設備4的方框圖。
圖20是圖19中的校正單元53的處理的流程圖。
具體實施方式
(第一實施例)
第一實施例的音頻校正設備1例如可用于諸如電視、個人電腦(PC)、平板式PC、智能手機等等的輸出帶有語音的移動圖像的裝置。
音頻校正設備1校正與移動圖像相對應的語音。該語音是相對應于該移動圖像被再生的語音。這個語音包括至少一個音頻成分。該音頻成分是通過作為聲源的各個物體發(fā)出的聲音,諸如是人的發(fā)聲、動物的發(fā)聲、背景聲音等等。
關于屬于移動圖像中的相同場景的圖像幀,通過使用對每個圖像幀通用的校正方法,該音頻校正設備校正該語音。
結果,與移動圖像相對應的語音被校正為觀眾容易聽見的語音。此外,移動圖像和語音通過時間信息被同步。
圖1是音頻校正設備1的方框圖。該音頻校正設備1包括獲取單元10、分離單元20、推測單元30、分析單元40、校正單元50、合成單元60以及輸出單元70。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經(jīng)株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210305970.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種被動自適應履帶可變形移動機器人平臺
- 下一篇:一種可變剛度的柔性機械手





