[發明專利]一種導航系統用戶語音自定義方法無效
| 申請號: | 201210554526.5 | 申請日: | 2012-12-14 |
| 公開(公告)號: | CN103093753A | 公開(公告)日: | 2013-05-08 |
| 發明(設計)人: | 徐小光;張璐;遲麗麗;謝振江;徐良;李峰 | 申請(專利權)人: | 沈陽美行科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G01C21/36 |
| 代理公司: | 沈陽晨創科技專利代理有限責任公司 21001 | 代理人: | 任玉龍 |
| 地址: | 110004 遼寧省沈陽*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 導航系統 用戶 語音 自定義 方法 | ||
1.一種導航系統用戶語音自定義方法,其特征在于:所述的導航系統用戶語音自定義方法硬件涉及定位模塊、算路模塊、引導模塊、TTS語音合成模塊、解碼模塊;
定位模塊,在汽車行駛過程中,通過硬件的GPS模塊獲取到位置信息;其中通信多數采用NMEA-0183協議,報文中包含定位所需要的坐標信息;模塊需要先解析報文,獲取位置坐標后再經過地圖匹配算法進行軌跡糾偏,最后獲取較精確的位置坐標;
算路模塊,提供了為從出發地到目的地為車輛尋找到駕駛時間最短的路線的功能;電子地圖保存了矢量化的道路網絡信息;道路網可以看作權值為正值的有向圖;算路模基于dijkstra算法在有向圖中搜索最短路徑;一個有權重的有向圖G,以及G中的一個來源頂點S中,以V表示G中所有頂點的集合;Dijkstra算法可以在一個圖中,找到從一個頂點s到任何其他頂點的最短路徑;
引導模塊,在駕駛過程中用戶可能會遇到限速,轉彎等情況;引導模塊就是在就算好的路線上,對用戶進行提示;在地圖數據中,保存了引導信息;當車輛行駛到帶有引導信息的坐標時,會觸發語音提示;引導模塊把引導信息轉換成提示字符串;比如“前方300米左轉,然后直行”;
TTS語音合成模塊,把引導模塊生成的提示字符串通過語言學處理,韻律處理和聲學處理合成為語音信號;
解碼模塊,作為數字信號的提示語音,以PCM編碼形式進行儲存;解碼模塊就是把語音編碼進行處理,然后進行D/A轉換,推動音響設備進行發音;
用戶自定義語音的實現基礎:
TTS語音合成引擎合成語音過程比較復雜,從而導致消耗過多的CPU資源;另外合成語音需要較長時間,會導致語音播報延時;通過優化,采用語音緩存的方式來解決這一問題;在進行引導過程中,90%的提示語音是經常出現的,這樣可以把語音緩存起來;語音緩存文件是由字符串索引和語音數據組成;
引導模塊生成緩存中有的字符串時,可以直接播放緩存中已有的聲音;這樣避免了采用TTS語音合成模塊生成語音的復雜過程,加快了語音實時播報的速度,也降低了系統資源的損耗;
在語音合成之前,系統會用引導信息的字符串和緩存中的每一條字符串索引進行比較,如果一致,命中緩存,則直接播放緩存中的語音,如果不一致,則利用TTS語音合成系統先合成語音,再進行播放;
用戶自定義提示語音是通過PC端軟件對語音緩存文件的編輯來完成的;最后生成自定義語音文件;自定義語音文件與語音緩存文件具有相同結構,都是由索引和數據部分構成;索引部分存儲了語音提示的字符串信息,而數據部分保存了PCM編碼的語音信息;索引文件采用了鏈式結果進行存儲;
PC端軟件首先讀取語音緩存文件,把緩存文件的索引字符串全部載入到內存;按條目顯示在PC端軟件上,用戶可以選擇所要自定義的字符串,對字符串進行朗讀錄音;PC端軟件調用底層硬件驅動程序,通過Codec芯片對模擬語音信號以32kbps進行采樣,最后把字符串索引和新錄制的語音寫入到用戶自定義語音文件中;
生成的新的自定義語音文件中,也存在相同的對應關系;錄制過的提示信息字符串語音數據部分被填充為用戶自己的語音,而沒有錄制的部分被設置為空數據;
自定義語音文件添加到導航設備,到導航系統啟用自定義語音功能時,在播放語音時系統優先在自定義語音文件中查找提示信息字符串;查找到字符串后,當提示信息字符串對應的錄制語音存在時,直接播放用戶錄制的語音數據;當沒有查找到提示信息字符串時,再到系統自帶語音文件中查找;
聲音錄制工具會顯示緩存中所有播報內容列表,用戶選中播報列表中的一條后,進行朗讀;聲音錄制工具把語音采集保存到數據文件中,導入到導航系統內作為自定義語音庫。
2.按照權利要求1所述的導航系統用戶語音自定義方法,其特征在于:所述的語音緩存文件中,每個提示信息字符串都對應著唯一的語音緩存數據;通過提示信息字符串就可以找到對應的聲音;緩存存儲文件采用鏈式結構,加載到內存時構造緩存索引鏈表,鏈表中每個節點包含索引字符串和語音數據在緩存文件中的偏移量信息;在每次比較字符串時,遍歷整個鏈表;如果命中,通過偏移量找到對應的語音數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽美行科技有限公司,未經沈陽美行科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210554526.5/1.html,轉載請聲明來源鉆瓜專利網。





