[發明專利]語音處理裝置、語音處理方法以及存儲介質有效
| 申請號: | 201580082452.1 | 申請日: | 2015-09-16 |
| 公開(公告)號: | CN107924686B | 公開(公告)日: | 2022-07-26 |
| 發明(設計)人: | 田村正統;森田真弘 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L25/18 | 分類號: | G10L25/18;G10L13/06 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 萬利軍;段承恩 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 裝置 方法 以及 存儲 介質 | ||
不僅能夠使波形的再現性提高而且能夠高速地生成波形。實施方式的語音處理裝置具有頻譜參數算出部、相位譜算出部、群延遲譜算出部、頻帶群延遲參數算出部以及頻帶群延遲修正參數算出部。頻譜參數算出部算出頻譜參數。相位譜算出部算出第1相位譜。群延遲譜算出部基于第1相位譜的頻率成分,根據第1相位譜算出群延遲譜。頻帶群延遲參數算出部根據群延遲譜算出預定頻率范圍中的頻帶群延遲參數。頻帶群延遲修正參數算出部算出對根據頻帶群延遲參數重新構建所得到的第2相位譜與第1相位譜之差進行修正的頻帶群延遲修正參數。
技術領域
本發明的實施方式涉及語音(聲音)處理裝置、語音處理方法以及存儲介質。
背景技術
分析語音波形來提取特征參數的語音分析裝置、和/或根據分析獲得的特征參數來合成語音的語音合成裝置,被廣泛地用于文本語音合成技術、語音編碼技術以及語音識別技術等語音處理技術。
現有技術文獻
專利文獻
專利文獻1:國際公開第2014/021318號
專利文獻2:日本特開2013-164572號公報
非專利文獻
非專利文獻1:坂野秀樹他、「時間領域平滑化群遅延を用いた短時間位相の効率的表現方法」、電子情報通信學會論文誌D-II Vol. J84-D-II、No.4、pp.621-628
發明內容
發明所要解決的問題
然而,以往存在難以利用于統計模型、在重新構建的相位與分析源波形的相位之間會產生偏離的問題。另外,以往存在當使用群延遲特征量進行波形生成時無法高速地生成波形這一問題。本發明所要解決的問題在于,提供能夠使語音波形的再現性提高的語音處理裝置、語音處理方法以及存儲介質。
用于解決問題的技術方案
實施方式的語音處理裝置具有頻譜參數算出部、相位譜算出部、群延遲譜算出部、頻帶群延遲參數算出部以及頻帶群延遲修正參數算出部。頻譜參數算出部針對輸入語音的各語音幀,算出頻譜參數。相位譜算出部針對所述各語音幀,算出第1相位譜。群延遲譜算出部基于所述第1相位譜的頻率成分,根據所述第1相位譜算出群延遲譜。頻帶群延遲參數算出部根據所述群延遲譜算出預定頻率范圍(frequency range)中的頻帶群延遲參數。頻帶群延遲修正參數算出部算出對根據所述頻帶群延遲參數重新構建所得到的第2相位譜與所述第1相位譜之差進行修正的頻帶群延遲修正參數。
附圖說明
圖1是表示實施方式涉及的語音分析裝置的構成例的框圖。
圖2是示例提取部所接收的語音波形和基音標記(pitch mark)的圖。
圖3是表示頻譜參數算出部的處理例的圖。
圖4是表示相位譜算出部的處理例和群延遲譜算出部的處理的圖。
圖5是表示頻率標度(scale)的制作例的圖。
圖6是示例進行了基于頻帶群延遲參數的分析所得的結果的圖。
圖7是示例根據頻帶群延遲修正參數進行了分析所得的結果的圖。
圖8是表示語音分析裝置所進行的處理的流程圖。
圖9是表示頻帶群延遲參數算出步驟的詳情的流程圖。
圖10是表示頻帶群延遲修正參數算出步驟的詳情的流程圖。
圖11是表示語音合成裝置的第1實施方式的框圖。
圖12是表示進行傅立葉逆變換以及波形疊加的語音合成裝置的構成例的圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580082452.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型的便攜式PH計
- 下一篇:一種具有轉動功能的電泳儀





