[實用新型]一種基于FPGA的藏語語音合成裝置有效
| 申請號: | 201621322986.5 | 申請日: | 2016-12-05 |
| 公開(公告)號: | CN206505717U | 公開(公告)日: | 2017-09-19 |
| 發明(設計)人: | 楊鴻武;張帥;甘振業 | 申請(專利權)人: | 西北師范大學 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04 |
| 代理公司: | 北京世譽鑫誠專利代理事務所(普通合伙)11368 | 代理人: | 孫國棟 |
| 地址: | 730070 甘肅省蘭州*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 fpga 藏語 語音 合成 裝置 | ||
技術領域
本實用新型涉及到藏語文本到藏語語音轉換的語音合成技術領域,具體涉及一種基于FPGA的藏語語音合成裝置。
背景技術
隨著現代社會信息技術的高速發展,高度智能的人機交互、人機互動技術,逐漸受到研究人員的日益重視。人們迫切希望同機器的交流方式,不僅僅停留在依靠于傳統的鍵盤、鼠標以及顯示器,完成指令的下發及思想的表達。而是有一種類似于人與人之間交流的方式進行交互,以達到“察言觀色”的效果,進而表達出真實的意圖。
隨著語音合成技術的成熟,其各種應用層出不窮,嵌入式語音合成的開發也成為爭相發展的熱門,TTS(Text To Speech)系統可以應用于計算機交互輸出、呼叫中心、雙語手機、PDA等各種設備上。現在比較流行的語音合成技術主要有基于大語料庫的語音拼接合成技術,此方法因為是直接從語料庫中挑選出語音片段進行拼接,所以合成的語音音質較好。但是此方法需要一個大的語料庫,制作語料庫不僅費時費力,而且占用大量的存儲空間。由于嵌入式設備,對存儲空間有一定的限制,所以此方法就不利于應用在嵌入式設備中。
另一種現在流行的語音合成方法,是基于HMM(Hidden Markov Models)的統計參數語音合成技術。此方法建立的語音合成系統特點:系統構建需要的數據量少,存儲尺寸小,合成時計算量少;并且合成的語音平滑流暢,魯棒性高,具有較好的音質和可懂度。
藏族作為我們中國的少數民族,有其悠久的歷史,它也有自己獨特的語言體系-藏語。藏族作為中國的少數民族之一,主要是分布在西藏自治區和青海、甘肅、四川、云南等省區,人口約640萬余人。而現在的研究主要集中在漢語的語音合成和應用中,對于藏語的語音合成裝置目前還沒有實現。
實用新型內容
針對上述存在的技術問題,本實用新型提供了一種基于FPGA的藏語語音合成裝置,在FPGA上實現藏語語音嵌入式的裝置,此裝置不僅可以合成流暢的藏語,同時方便攜帶。
一種基于FPGA的藏語語音合成裝置,包括FPGA芯片,文本輸入設備,FLASH存儲器,SDRAM存儲器,音頻輸出設備;所述FPGA芯片包括NiosⅡ軟核處理器、Avalon總線、輸入設備控制器、FLASH存儲器接口、SDRAM控制器、音頻控制器、PLL鎖相環、UART控制器以及用于語音合成的協處理器;所述NiosⅡ軟核處理器通過所述Avalon總線分別與輸入設備控制器、FLASH存儲器接口、SDRAM控制器、音頻控制器、PLL鎖相環、UART控制器和協處理器相連;所述文本輸入裝置與文本輸入控制器相連,所述FLASH存儲器與FLASH存儲器接口相連,SDRAM存儲器與SDRAM控制器相連,音頻輸出設備與音頻控制器相連;所述協處理器包括浮點單元、語音參數生成器、語音合成生成器和內部存儲器;所述浮點單元通過設置浮點單元總線與語音參數生成器和語音合成生成器相連,所述內部存儲器通過設置內部存儲器總線與語音參數生成器和語音合成生成器相連;所述內部存儲器、語音參數生成器和語音合成生成器分別與Avalon總線相連。
進一步的,所述音頻輸出設備連接有外置的音箱。
本實用新型以FPGA為開發平臺,利用NiosII進行軟核處理器的設計,建立各個功能算法的硬件平臺,最終將語音合成算法移植到FPGA硬件平臺中,從而達到實現藏語語音合成的功能;FPGA平臺內部處理結構,其中協處理器集成到系統中以便加速系統的性能,Nios II處理器是系統的主要處理器,SDRAM存儲器用于存儲系統的指令和數據,PLL鎖相環用于設置系統的時鐘頻率。UART端口用于調試系統。基于HMM的統計參數語音合成技術下,利用Nios軟核作為處理器,在嵌入式設備FPGA開發平臺上實現藏語語音的合成。此裝置突破了嵌入式設備存儲空間的限制,不僅可以合成流暢的藏語語音,同時實現了藏語語 音合成的便攜化和儀器化。尤其用Nios軟核的形式作為處理器,其靈活的設計方式,使系統的可裁剪,可擴充,可升級的效果更易實現。
附圖說明
為了更清楚地說明本實用新型實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本實用新型的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為一種基于FPGA的藏語語音合成裝置的模塊示意圖;
圖2為基于HMM藏語語音合成系統的流程圖;
圖3為藏語文本分析流程圖;
圖4為語音合成生成器流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北師范大學,未經西北師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201621322986.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可調容性交叉耦合結構及腔體濾波器
- 下一篇:一種可調式同軸衰減器





