[發明專利]一種利用網絡提供語音辨識引擎的系統及其方法無效

申請號：	200710077499.6	申請日：	2007-11-30
公開（公告）號：	CN101452703A	公開（公告）日：	2009-06-10
發明（設計）人：	王瑞璋	申請（專利權）人：	王瑞璋;王中平
主分類號：	G10L15/28	分類號：	G10L15/28;G10L15/00;G10L15/06
代理公司：	深圳市順天達專利商標代理有限公司	代理人：	蔡曉紅
地址：	臺灣省臺北***	國省代碼：	中國臺灣;71
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種利用網絡提供語音辨識引擎系統及其方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種提供語音辨識引擎的系統與方法，特別涉及一種利用網絡提供個別使用者在多重裝置使用語者相關語音辨識引擎的系統與方法。

背景技術

語音辨識技術是供使用者更為便利地操作各式電子裝置，例如桌上型電腦、筆記本電腦、手機或個人數位助理器等。使用者僅需利用例如麥克風等語音輸入裝置，即可將其發話轉變為文字或更進一步轉變為指令，供使用者得以更為便利地進行輸入或操作各式電子裝置。舉例而言，就語音辨識技術來說，使用者可采用口述方式寫作，或使用手機時進行語音撥號。語音辨識技術不僅對于一般使用者帶來極大的便利性，對于例如肢體障礙或肌肉萎縮等特殊使用者而言，更彌足珍貴。

一般而言，在語音辨識技術的使用方面，語音辨識引擎可分為兩種模式：一種為與語者相關的語音辨識引擎，另一種則為與語者獨立的語音辨識引擎。

首先，關于與語者獨立的語音辨識引擎方面，由于其是預先存入大量各式語者的語音樣本，因此，使用者可不必經過訓練該語音辨識引擎的過程，而可直接使用。然而，雖其可省略訓練語音辨識引擎的步驟，由于每個人發音皆有差異，以非使用者本身的語音樣本作為判斷標準，將導致使用與語者獨立的語音辨識的準確率遠低于使用與語者相關的語音辨識引擎者。

關于與語者相關之語音辨識引擎方面，使用者需要先對該語音辨識引擎進行訓練或調適，即需輸入該使用者自身的樣本語音，方可開始使用該語音辨識引擎。以手機語音撥號功能為例，使用者必須先錄制其自身的語音，例如收話人姓名，而后方可開始使用。雖其語音辨識正確率較高，然而于其使用上則極為不便。換句話說，當使用者辛苦地訓練完成于其所使用的電子裝置內的語者相關語音辨識的引擎，若欲替代以新的電子裝置時，則必須重新對新更換電子裝置內的語者相關語音辨識引擎進行訓練；就以手機為例，在更換一新手機后，使用者必須重新將所有語音資料重新錄制在新手機內，以訓練其內的語者相關語音辨識引擎，供使用者使用。

由于電子裝置的普遍化，每個使用者可能同時擁有多種電子裝置。如上所述，使用語者相關語音辨識引擎時，使用者在不同種類的電子裝置皆必須重復進行訓練的過程，此不僅虛耗使用者的寶貴時光，更將耗損使用者對于語音辨識使用的興趣。反之，若能有效的解決此等利用語者相關語音辨識引擎的不便，或將能使辨識能力較為精確的語者相關語音辨識引擎的利用更為普及，進而促進語音科技產業的發展。

發明內容

本發明要解決的技術問題在于提供一種能夠克服上述現有技術缺陷的利用網絡提供語音辨識引擎的系統及其方法，本發明能保留與語者相關的語音辨識引擎的高正確率而不需先執行冗長的訓練工作，有效節省使用者時間，方便使用者在不同裝置上使用語者相關的語音辨識引擎。

本發明還提供一種可以利用網絡長期采集同一使用者在不同裝置上語音樣本，且用于產生不需使用者先經過訓練即可在新裝置上使用的語者相關語音辨識引擎，從而不斷銳化使用者在各裝置上所使用的語者相關語音辨識引擎，而使其語音辨識引擎更符合使用者自身的需求。

本發明上述技術問題通過下述技術方案實現：一種利用網絡提供語音辨識引擎的系統，包括：

存儲單元，用于存儲使用者在任何錄制裝置上錄制的語音；以及

語音辨識引擎產生單元，根據使用者所錄制的語音以及各錄制裝置的特性，產生適合各錄制裝置上使用的語者相關語音辨識引擎。

在本發明所提供的系統中，還包括使用者登錄單元，供不同使用者在所使用語音辨識的錄制裝置上，經由網絡登入系統。

在本發明所提供的系統中，還包括引擎下載單元，供使用者下載各語者相關的語音辨識引擎至各該對應的錄制裝置上，以使用語者相關的語音辨識功能。

在本發明所提供的系統中，所述錄制裝置是手機、桌上型電腦、筆記本電腦或個人行動助理器。

在本發明所提供的系統中，所使用的網絡為互聯網、移動電話通信網絡或固定式電話通信網絡。

在本發明所提供的系統中，所述語音辨識引擎產生單元是經由模型訓練技術或模型調適技術，根據該使用者的聲音以及該錄制裝置的特性，以產生適用于該錄制裝置上的語者相關語音辨識引擎。

一種利用網絡提供語音辨識引擎的方法，包括以下步驟：