[發明專利]基于共振峰頻率的漢語普通話單韻母語音可視化方法無效

申請號：	200910235647.1	申請日：	2009-10-10
公開（公告）號：	CN102176313A	公開（公告）日：	2011-09-07
發明（設計）人：	趙勝輝;董欣瑋;王晶;匡鏡明	申請（專利權）人：	北京理工大學
主分類號：	G10L21/06	分類號：	G10L21/06
代理公司：	北京理工大學專利中心 11120	代理人：	張利萍;高燕燕
地址：	100081 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于共振頻率漢語普通話韻母語音可視化方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種漢語普通話單韻母語音可視化方法，特別是一種基于共振峰頻率的漢語普通話單韻母語音可視化方法，屬于語音可視化領域。

背景技術

語音是人說話時發出的聲音，在人們的日常生活中是不可或缺的。但對于聽力障礙者而言，無法通過聽覺感知語音，造成正常人難以體會的痛苦。研究表明，在人們對外界的感知過程中，獲取信息最多的是視覺，其次才是聽覺，而且視覺和聽覺的結合比任何單一感官所感知的信息都要多。另外，經驗告訴我們，圖表是人們表達思想、理解事物最方便、最直觀的方法，所以人們也試圖從視覺上來感知語音，或者利用視覺和聽覺的結合來傳遞更多的有用信息。本發明的目的就是探索和尋找一種語音的可視化方法，即利用視覺元素來表現語音，達到“通過視覺感知語音”的目的，為聽力障礙者理解語音、練習正確發音提供實際幫助。

本發明之前，發明語音可視化方法很多都是基于人臉模型。這種方法對發音口型進行定性或定量的描述。定性描述如圓唇、扁唇、開口的大小，舌位的高低等等。現在許多應用領域需要對視覺語音進行客觀上的定量度量，如虛擬人臉合成、機器自動唇讀等等。MPEG-4更是定義了人臉動畫參數FAP(facialanimation?parameter)。FAP參數的優點使它已經成為人臉動畫的國際標準。

基于發音器官的運動變化、人臉的表情來實現語音可視化的方法較為人性化，有效剖析了人體的發音過程，有助于聽力受損人群練習發音。然而，就其?語音可懂度而言，還難以達到理想效果，除極少數專家以外，人們很難直接通過觀察發音器官的運動而準確、有效的感知語音。此外，視覺效果比較單一，表現力不強。

發明內容

本發明的目的在于提供一種基于共振峰頻率的漢語普通話單韻母語音可視化方法，能夠將不同語音特征整合為單一圖像，使圖像具有可讀性，直觀地讀出連續講話的語音序列。

本發明的技術方案是：一種基于共振峰頻率的漢語普通話單韻母語音可視化方法，包括以下步驟：

第一步：對原始語音信號分幀、加窗，提取每幀信號的短時能量、共振峰頻率、基音頻率；

第二步：采用中值平滑方法糾正共振峰頻率、基音頻率個別數值的錯誤；

第三步：利用共振峰頻率將不同發音映射為不同色彩方面，采用以下公式：

R=0.9*(0.0006*310*F1F2+0.002*5F3F2)]]>