[發(fā)明專利]數(shù)字雙向智能語音講解系統(tǒng)及其方法有效
| 申請?zhí)枺?/td> | 201110353172.3 | 申請日: | 2011-11-09 |
| 公開(公告)號: | CN102436808A | 公開(公告)日: | 2012-05-02 |
| 發(fā)明(設(shè)計(jì))人: | 陸德寶;呂杰;吳海濤 | 申請(專利權(quán))人: | 武漢安通科技產(chǎn)業(yè)發(fā)展有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L15/02;G10L15/22 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 王丹 |
| 地址: | 430017 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)字 雙向 智能 語音 講解 系統(tǒng) 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音講解系統(tǒng),主要應(yīng)用于各種場館,對產(chǎn)品、展品的智能語音講解和智能人機(jī)語音交互。
背景技術(shù)
隨著電子技術(shù)和信息技術(shù)的不斷發(fā)展,特別是語音識別算法和語音合成算法的發(fā)展,用其取代重復(fù)的人力勞動,并能體現(xiàn)其人性化的操作。市面上也有類似的講解系統(tǒng),但大多是基于語音存儲與調(diào)用的方式,這種架構(gòu),語音發(fā)音是預(yù)先存放在存儲器中的語音數(shù)據(jù)文件的調(diào)用,發(fā)音也比較死板,系統(tǒng)人性化和可維護(hù)性差。也有系統(tǒng)基于TTS,但算法必須依托與PC完成,在具體應(yīng)用中,系統(tǒng)成本高,特別是上一定規(guī)模的系統(tǒng),穩(wěn)定性也無法保證。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是:提供一種數(shù)字雙向智能語音講解系統(tǒng),其各終端裝置可獨(dú)立工作。
本發(fā)明為解決上述技術(shù)問題所采取的技術(shù)方案為:數(shù)字雙向智能語音講解系統(tǒng),包括PC服務(wù)器和終端裝置,其特征在于:所述的PC服務(wù)器包括:網(wǎng)絡(luò)接口單元,用于PC服務(wù)器與各終端裝置間的通訊;發(fā)音文本庫,用于預(yù)先存放需要播放的文本文件及其對應(yīng)的終端號;語音識別關(guān)鍵字庫,用于預(yù)先存放各終端裝置語音識別關(guān)鍵字及其對應(yīng)的終端號;終端監(jiān)控管理單元,用于監(jiān)控和管理各終端裝置的在線狀態(tài)和運(yùn)行狀態(tài);終端設(shè)備數(shù)據(jù)庫,用于存放各終端號、狀態(tài)信息、當(dāng)前發(fā)音文本編號和當(dāng)前識別關(guān)鍵字編號;
所述的終端裝置包括網(wǎng)絡(luò)通訊單元,用于與PC服務(wù)器之間的通訊;存儲單元,用于存放由網(wǎng)絡(luò)通訊單元傳遞過來的發(fā)音文本和語音識別關(guān)鍵字;TTS發(fā)音單元,用于將發(fā)音文本進(jìn)行語音合成,輸出數(shù)字語音信號;拾音單元,用于等待用戶發(fā)出的語音命令并進(jìn)行本地語音采集;語音識別單元,用于將拾音單元采集到的語音信息進(jìn)行建模識別,將識別后的結(jié)果與識別項(xiàng)進(jìn)行對比,然后觸發(fā)TTS發(fā)音單元進(jìn)行語音合成;觸發(fā)接收單元,用于本地觸發(fā)控制音頻切換單元,選擇由機(jī)器自動講解和人工講解兩種方式;D/A轉(zhuǎn)換單元,用于將TTS發(fā)音單元輸出的數(shù)字語音信號轉(zhuǎn)換成模擬語音信號;音頻切換單元,用于切換機(jī)器合成的模擬語音信號和人工麥克風(fēng)的模擬語音信號;功放單元,用于將音頻切換單元輸出的模擬語音信號進(jìn)行功率放大,并傳送給喇叭。
所述的各終端裝置的運(yùn)行狀態(tài)包括異常狀態(tài)、講解狀態(tài)、識別狀態(tài)和待機(jī)狀態(tài)。
數(shù)字雙向智能語音講解方法,其特征在于:它包括以下步驟:
步驟1、從配置好的發(fā)音文本庫和語音識別關(guān)鍵字庫選擇需要發(fā)音的發(fā)音文本、語音識別關(guān)鍵字和相應(yīng)終端號進(jìn)行綁定;
步驟2、終端裝置的網(wǎng)絡(luò)通訊單元與PC服務(wù)器的網(wǎng)絡(luò)接口單元通信,從PC服務(wù)器下載其對應(yīng)終端號的語音識別關(guān)鍵字和發(fā)音文本,并存放在存儲單元;
步驟3、拾音單元接收講解員的語音控制命令;
步驟4、語音識別單元對接收的語音控制命令識別后,在存儲單元中根據(jù)識別結(jié)果找到對應(yīng)的發(fā)音文本,并將發(fā)音文本儲存地址傳遞給TTS發(fā)音單元;
步驟5、TTS發(fā)音單元將對應(yīng)的發(fā)音文本轉(zhuǎn)換成數(shù)字語音信號并傳遞給D/A轉(zhuǎn)換單元轉(zhuǎn)換為模擬語音信號;
步驟6、判斷觸發(fā)接收單元是否接收到觸發(fā)信號:若有則由音頻切換單元將拾音單元接收到的語音控制命令直接傳送到功放單元進(jìn)行本地?cái)U(kuò)聲;若無則由D/A轉(zhuǎn)換單元將已轉(zhuǎn)換的模擬語音信號傳給功放單元進(jìn)行功率放大,并傳送給喇叭進(jìn)行播放;
步驟7、PC服務(wù)器的終端監(jiān)控單元時刻監(jiān)測所有終端裝置,定時發(fā)送查詢命令給每一個終端裝置,然后等待對應(yīng)終端裝置的返回命令,并將對應(yīng)終端的在線狀態(tài)和運(yùn)行狀態(tài)保存在終端設(shè)備數(shù)據(jù)庫中;
本發(fā)明的有益效果為:
1、本系統(tǒng)基于TTS,其中PC服務(wù)器僅供管理和配置相應(yīng)文件,各終端裝置可獨(dú)立工作,具備更好的穩(wěn)定性。
2、與現(xiàn)有講解系統(tǒng)只能按照預(yù)存的發(fā)音文本進(jìn)行發(fā)音講解不同,本系統(tǒng)各終端裝置可選擇按預(yù)存發(fā)音文本發(fā)音,或者直接將講解員的現(xiàn)場聲音進(jìn)行擴(kuò)音,不受機(jī)器干擾,以滿足需求最大化和在設(shè)備出現(xiàn)故障時的應(yīng)急措施。
3、發(fā)音文件以文本的形式存放和管理,占用資源小,應(yīng)用靈活性強(qiáng),可維護(hù)性強(qiáng);可以通過修改文本即可改變發(fā)聲內(nèi)容。
4、語音識別關(guān)鍵字以文本形式存放和管理,可根據(jù)場館不同需求進(jìn)行配置修改,甚至當(dāng)場管中展品有所變動時,同樣能通過服務(wù)器快速配置,靈活性非常大。
附圖說明
圖1為終端裝置結(jié)構(gòu)框圖。
圖2為PC服務(wù)器結(jié)構(gòu)框圖。
圖3為PC服務(wù)器系統(tǒng)流程圖。
圖4為終端裝置系統(tǒng)流程圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢安通科技產(chǎn)業(yè)發(fā)展有限公司,未經(jīng)武漢安通科技產(chǎn)業(yè)發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110353172.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





