[發(fā)明專利]可進(jìn)行語音識別處理的瀏覽器及處理方法有效
| 申請?zhí)枺?/td> | 201210488924.1 | 申請日: | 2012-11-26 |
| 公開(公告)號: | CN103020165A | 公開(公告)日: | 2013-04-03 |
| 發(fā)明(設(shè)計)人: | 楊東;任寰 | 申請(專利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L15/26 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100088 北京市西城區(qū)新*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 進(jìn)行 語音 識別 處理 瀏覽器 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)通信技術(shù)領(lǐng)域,特別涉及一種可進(jìn)行語音識別處理的瀏覽器及瀏覽器中進(jìn)行語音識別處理的方法。
背景技術(shù)
語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
瀏覽器是指可以顯示網(wǎng)頁服務(wù)器或者文件系統(tǒng)的HTML(Hypertext?Markup?Language,超文本標(biāo)記語言)文件內(nèi)容,并讓用戶與這些文件交互的一種軟件。網(wǎng)頁瀏覽器主要通過HTTP(Hypertexttransfer?protocol,超文本傳遞協(xié)議)協(xié)議與網(wǎng)頁服務(wù)器交互并獲取網(wǎng)頁,這些網(wǎng)頁由URL(Uniform/Universal?Resource?Locator,統(tǒng)一資源定位符)指定,文件格式通常為HTML,并由MIME(MultipurposeInternet?Mail?Extensions,多功能互聯(lián)網(wǎng)郵件擴充服務(wù))在HTTP協(xié)議中指明。
現(xiàn)有的瀏覽器大多沒有集成語音識別功能,即是個別瀏覽器集成了語音識別功能,一般只基于本地語音識別引擎或只基于WEB(網(wǎng)絡(luò))語音識別引擎,識別效率低、準(zhǔn)確性差。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種可進(jìn)行語音識別處理的瀏覽器及瀏覽器中進(jìn)行語音識別處理的方法。
依據(jù)本發(fā)明的一個方面,提供了一種可進(jìn)行語音識別處理的瀏覽器,其包括:
處理器,適于接收用戶輸入指令設(shè)置瀏覽器的聲控模式為命令輸入模式或者文本輸入模式;
語音接收器,適于接收用戶的語音輸入,并轉(zhuǎn)換為語音數(shù)據(jù);
本地識別單元,適于調(diào)用瀏覽器側(cè)本地語音識別引擎對所述語音數(shù)據(jù)進(jìn)行識別,接收本地語音識別結(jié)果,如果識別成功,則依據(jù)本地語音識別結(jié)果在所述命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理;
WEB識別單元,適于在所述本地識別單元識別失敗的情況下,調(diào)用WEB語音識別引擎對所述語音數(shù)據(jù)進(jìn)行識別,接收來自WEB語音識別引擎的WEB語音識別結(jié)果,依據(jù)WEB語音識別結(jié)果在命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理。
可選地,所述本地識別單元包括:
本地調(diào)用模塊,適于調(diào)用本地語音識別引擎對所述語音數(shù)據(jù)進(jìn)行識別,接收本地語音識別結(jié)果;
本地判斷模塊,適于判斷所述本地語音識別結(jié)果是否為空,如果是,認(rèn)為識別失敗,向WEB識別單元發(fā)送啟動通知;否則,判斷當(dāng)前聲控模式是否是文本輸入模式,如果是,認(rèn)為識別成功,在所述瀏覽器中輸入所述本地語音識別結(jié)果對應(yīng)的輸入文本,否則,向本地匹配模塊發(fā)送本地匹配指令;
所述本地匹配模塊,適于根據(jù)所述本地匹配指令,將所述本地語音識別結(jié)果與所述瀏覽器的命令集進(jìn)行匹配,如果匹配成功,按照所述本地語音識別結(jié)果執(zhí)行相應(yīng)的瀏覽器操作,否則,認(rèn)為識別失敗,向WEB識別單元發(fā)送啟動通知。
可選地,所述WEB識別單元包括:
通知接收模塊,適于接收所述本地識別單元發(fā)送的啟動通知;
WEB調(diào)用模塊,適于調(diào)用WEB語音識別引擎對所述語音數(shù)據(jù)進(jìn)行識別,接收來自WEB語音識別引擎的WEB語音識別結(jié)果;
WEB判斷模塊,適于判斷當(dāng)前聲控模式是否是文本輸入模式,如果是,在所述瀏覽器中輸入所述WEB語音識別結(jié)果對應(yīng)的輸入文本,否則,向WEB匹配模塊發(fā)送WEB匹配指令;
WEB匹配模塊,適于根據(jù)所述WEB匹配指令將所述WEB語音識別結(jié)果與所述瀏覽器的命令集進(jìn)行匹配,并按照所述WEB語音識別結(jié)果執(zhí)行相應(yīng)的瀏覽器操作。
可選地,所述命令集包括所述瀏覽器的操作命令。
可選地,所述瀏覽器還包括:訓(xùn)練語音識別單元;
所述訓(xùn)練語音識別單元包括:
訓(xùn)練語音庫建立模塊,適于預(yù)先對用戶的語音數(shù)據(jù)進(jìn)行訓(xùn)練,生成包含訓(xùn)練語音及相應(yīng)的輸入文本或相應(yīng)的所述操作命令的訓(xùn)練語音庫;
訓(xùn)練語音匹配模塊,適于將所述語音數(shù)據(jù)與所述訓(xùn)練語音庫中的訓(xùn)練語音相匹配,如果匹配成功,在文本輸入模式下,在所述瀏覽器中輸入相應(yīng)的輸入文本,或者,在命令輸入模式下,按照相應(yīng)的操作命令執(zhí)行相應(yīng)的瀏覽器操作。
可選地,所述訓(xùn)練語音識別單元還包括:提示模塊;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210488924.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





