[發明專利]基于外部開啟控制語音輸入的網絡語音轉換控制系統和方法有效

申請號：	201210329762.7	申請日：	2012-09-07
公開（公告）號：	CN102855875A	公開（公告）日：	2013-01-02
發明（設計）人：	吳玉勝;李新崗	申請（專利權）人：	深圳市信利康電子有限公司
主分類號：	G10L15/26	分類號：	G10L15/26
代理公司：	廣東國暉律師事務所 44266	代理人：	趙瓊花
地址：	518000 廣東省深圳市福***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于外部開啟控制語音輸入網絡轉換控制系統方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種語音轉換控制系統和方法，尤其涉及一種基于外部開啟控制語音輸入的網絡語音轉換控制系統和方法。

背景技術

????隨著社會的發展及語音技術的提高，語音控制越來越來廣泛應用。現有語音控制大多在設備上設置嵌入語音識別芯片，存儲的語音指令及內容，通過語音識別后調用存儲的指令和內容，從而進行語音控制。現有技術基于網絡進行語音識別，則通常采用與電腦或智能設備直接通過網絡連接進行語音輸入和識別，并不具備外部開啟控制的網絡語音轉換控制系統和方法。現有技術的語音識別轉換適用于專門的電腦或智能設備，不具備通用性，不能充分利用網絡語音轉換的功能，需要開發專門的語音輸入及控制系統。同時，現有語音輸入識別多需要標準的語音，對于自然語音則難以準確執行。

發明內容

本發明解決的技術問題是：構建一種基于外部開啟控制語音輸入的網絡語音轉換控制系統和方法，克服現有技術語音識別轉換不具備通用性及不能充分利用網絡語音轉換的功能以及不能使用自然語音進行轉換執行的技術問題。?

本發明的技術方案是：構建一種基于外部開啟控制語音輸入的網絡語音轉換控制系統，包括輸入語音的語音輸入單元、傳送語音信息的終端、進行語音識別轉換的網絡服務器，所述終端包括連接所述網絡服務器的網絡連接模塊、進行語音識別的第一語音轉換單元，所述語音輸入單元連接所述終端，所述語音輸入單元包括開啟所述網絡連接模塊建立網絡連接的開啟模塊，所述網絡服務器包括對接收的所述終端傳送的語音信息進行識別轉換的第二語音轉換單元，所述開啟模塊開啟所述終端的所述網絡連接模塊建立網絡連接，所述語音輸入單元輸入語音，所述終端將語音信息上傳到的所述網絡服務器，所述網絡服務器的第二語音轉換單元和所述終端的第一語音轉換單元將語音信息并行進行識別轉換，該語音識別轉換結果由所述網絡服務器和所述終端共同執行或由所述終端傳送或單獨執行。

本發明的進一步技術方案是：所述第二語音轉換單元包括還包括語音識別模塊和語義識別模塊，所述語義識別模塊配合所述語音識別模塊識別的語音判斷出所述語音輸入單元輸入語音的語義。

本發明的進一步技術方案是：所述網絡服務器和所述終端的語音識別轉換結果均包括語音識別轉換的置信度，所述終端設置語音識別轉換結果的置信度閾值，當所述終端語音識別轉換結果的置信度大于等于該置信度閾值時，取該語音識別轉換結果，若所述終端語音識別轉換結果的置信度小于該置信度閾值時，取所述網絡服務器語音識別轉換結果的置信度和所述終端語音識別轉換結果的置信度中較大值的語音識別轉換結果。

本發明的進一步技術方案是：所述網絡服務器和所述終端均設置或其中任意一個設置存儲語音指令及與語音指令相配合的內容的存儲單元。

本發明的進一步技術方案是：所述語音輸入單元通過USB接口連接所述終端。

本發明的進一步技術方案是：所述終端為電腦、移動通訊終端、電子玩具終端、家用電器中的一種或多種。

本發明的技術方案是：構建一種基于外部開啟控制語音輸入的網絡語音轉換控制方法，包括輸入語音的語音輸入單元、傳送語音信息的終端、進行語音識別轉換的網絡服務器，所述終端包括網絡連接模塊，所述語音輸入單元包括開啟所述網絡連接模塊建立網絡連接的開啟模塊，所述網絡語音轉換控制方法包括如下步驟：

開啟終端并輸入語音：由所述開啟模塊開啟所述網絡連接模塊，使所述終端與所述網絡服務器建立網絡連接，由所述語音輸入單元輸入語音；

接收并上傳語音：所述終端接收所述語音輸入單元輸入的語音并上傳到網絡服務器；

語音識別轉換：所述終端與所述網絡服務器并行對所述語音信息進行識別轉換；

執行識別轉換結果：所述網絡服務器和所述終端共同執行或由所述終端傳送或單獨執行語音識別轉換結果。

本發明的進一步技術方案是：還包括根據識別場景構建語義知識庫，所述語義知識庫包括字詞的語義屬性，在語音識別轉換步驟中，還包括進行語義識別轉換，具體包括如下步驟：

分詞及語義消歧：根據知識庫字詞的語義屬性對語音識別結果進行分詞并進行語義消歧；

意圖分類及參數提取：對分詞及語義消歧的結果進行意圖分類，并進行參數提取。

本發明的進一步技術方案是：在輸入不能識別語音信息或不能執行的語音信息時，通過所述終端輸入語音與所述網絡服務器進行交互語音，以獲取所述網絡服務器能執行的語音信息。