[發(fā)明專利]一種基于語音識別字符索引的查找方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310001330.8 | 申請日: | 2013-01-04 |
| 公開(公告)號: | CN102999639A | 公開(公告)日: | 2013-03-27 |
| 發(fā)明(設計)人: | 柏鳳佳 | 申請(專利權)人: | 深圳市中興移動通信有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L15/08;G10L15/26 |
| 代理公司: | 廣東廣和律師事務所 44298 | 代理人: | 曹建軍 |
| 地址: | 518000 廣東省深圳市南山區(qū)*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語音 識別 字符 索引 查找 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及移動通信領域,尤其涉及一種基于語音識別字符索引的快速查找方法及系統(tǒng)。
背景技術
隨著移動通信領域技術的不斷發(fā)展和成熟,在日益普及的移動終端中,特別是智能終端中軟件功能越來越豐富,用戶的個性化需求越來越多。但隨著移動操作系統(tǒng)和硬件平臺的日趨統(tǒng)一,軟件功能的同質(zhì)化也日趨嚴重。不斷創(chuàng)新引入語音識別等新的交互方式成為保持終端產(chǎn)品競爭力的重要途徑。
語音識別作為一種新的、重要的用戶交互技術在移動終端中的應用越來越廣泛。隨著語音識別技術的不斷發(fā)展和云端語音服務器的引入,語音識別率有了很大提升,但從目前移動終端中已推出的語音產(chǎn)品的實際性能看,使用效果并不理想,技術還沒有完全成熟。特別是存在因為用戶使用習慣、地域的不同,語言發(fā)音不用,國別不同等識別誤差范圍較大,準確率不高的問題。同時,依靠云端語音服務器的自然語言解析方式,依賴于網(wǎng)絡,需要大量的數(shù)據(jù)交互操作,會引起用戶網(wǎng)絡流量的費用問題,而且當網(wǎng)絡狀態(tài)不好時,識別率會很低,用戶使用場景受限。
號碼查找功能是移動終端中的一項十分重要的,核心的功能。就目前已上市的產(chǎn)品來說,號碼查找功能都是通過鍵盤或觸屏虛擬鍵盤輸入聯(lián)系人名稱或號碼相關信息進行查找匹配,不支持通過語音識別進行字符索引快速查找的功能。
因此,為了彌補上述技術的不足,本發(fā)明提出一種新的,基于語音識別字符索引的快速查找方法及系統(tǒng)。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術中存在的缺陷或不足,本發(fā)明提供了一種基于語音識別字符索引的查找方法及系統(tǒng)。
為解決上述技術問題,本發(fā)明提供的技術方案為:一種基于語音識別字符索引的查找方法,該方法包括如下步驟:
用戶語音輸入基本字符,識別出用戶讀出的各個基本字符組合的語音,轉(zhuǎn)譯成基本字符組合文本索引,并進一步轉(zhuǎn)譯成標準的按鍵事件、觸屏事件或用戶識別的自定義事件,通過標準的事件傳遞函數(shù)傳遞給需要進行查找的應用場景或界面,實現(xiàn)語音識別字符索引的查找。
本發(fā)明還提供了一種基于語音識別字符索引的查找方法,該方法具體包括如下步驟:
步驟11:語音識別引擎服務啟動;
步驟12:用戶語音輸入基本字符,作為語音識別的字符索引;
步驟13:語音識別引擎服務接收到用戶語音后,讀取語音特征庫,遍歷,獲取與用戶語音輸入基本字符相匹配的語音特征文件,并將識別出的語音轉(zhuǎn)譯成文本字符;
步驟14:將上述文本字符轉(zhuǎn)移為標準的按鍵或觸屏事件或用戶識別的自定義事件,調(diào)用標準的事件傳遞函數(shù),傳遞給當前的快速查找應用場景或應用;
步驟15:進行文本字符模糊匹配,將匹配的結果信息通過界面或其他形式反饋給用戶,提示用戶當前的匹配狀態(tài);如果匹配結束或匹配結果為空,查找方法結束,執(zhí)行步驟12;否則,轉(zhuǎn)到步驟16;
步驟16:用戶再次語音輸入基本字符,轉(zhuǎn)到步驟13。
優(yōu)選的,語音識別引擎服務通過狀態(tài)欄圖標或者通知欄通知消息提示用戶語音識別服務當前的狀態(tài),以此確認當前是否支持基于語音識別字符索引的快速查找功能。
優(yōu)選的,步驟15中,如果匹配結束或匹配結果為空,查找方法結束后,執(zhí)行步驟12前,還包括如下步驟:一段時間內(nèi)沒有執(zhí)行步驟12,語音識別引擎服務休眠或關閉,該一段時間的長度由用戶根據(jù)實際需求分等級設定。
優(yōu)選的,語音識別的語音特征庫包含各個基本字符的語音特征文件:字母A-Z,數(shù)字0~9,特殊符號*#+。
本發(fā)明還提供了一種基于語音識別字符索引的查找系統(tǒng),該系統(tǒng)包括:
語音識別引擎服務裝置,用于識別用戶語音輸入的基本字符,以作為語音識別的字符索引;
讀取轉(zhuǎn)譯裝置,用于讀取語音特征庫,遍歷,獲取與語音識別引擎服務裝置識別的語音輸入的基本字符匹配的語音特征文件,并將識別出的語音轉(zhuǎn)譯成文本字符;
轉(zhuǎn)譯識別裝置,用于將上述文本字符轉(zhuǎn)譯為標準的按鍵或觸屏事件或用戶識別的自定義事件,調(diào)用標準的事件傳遞函數(shù),傳遞給當前的快速查找應用場景或應用;
匹配裝置,用于進行文本字符模糊匹配,將匹配的結果信息通過界面或其他形式反饋給用戶,提示用戶當前的匹配狀態(tài)。
優(yōu)選的,語音識別的語音特征庫包含各個基本字符的語音特征文件:字母A-Z,數(shù)字0~9,特殊符號*#+。
本發(fā)明的有益效果在于:
1.本發(fā)明涉及的號碼查找算法是基于基本字符語音特征庫的,語音識別的計算量較小,識別準確率高,速度快,設計實現(xiàn)更簡單,占用系統(tǒng)資源更少。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市中興移動通信有限公司,未經(jīng)深圳市中興移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310001330.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種改良型空心鉆頭
- 下一篇:具有帶內(nèi)螺紋的頸部的玻璃容器





