[發(fā)明專利]語音識別方法和裝置有效
| 申請?zhí)枺?/td> | 201410129541.4 | 申請日: | 2014-04-01 |
| 公開(公告)號: | CN103915092B | 公開(公告)日: | 2019-01-25 |
| 發(fā)明(設計)人: | 李博;王志謙;胡娜;穆向禹;賈磊;魏偉 | 申請(專利權)人: | 百度在線網(wǎng)絡技術(北京)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
本發(fā)明提出一種語音識別方法和裝置,該語音識別方法包括采集用戶輸入的語音信息;對所述語音信息進行特征提取,得到特征信息;根據(jù)預先獲取的聲學模型和語言模型,對所述特征信息進行解碼,得到識別后的語音信息,其中,所述聲學模型為預先進行數(shù)據(jù)壓縮后得到的。該方法能夠不依賴網(wǎng)絡實現(xiàn)語音識別。
技術領域
本發(fā)明涉及智能處理技術領域,尤其涉及一種語音識別方法和裝置。
背景技術
語音識別是信息技術領域重要的技術之一,語音識別的目標是使機器聽懂人的自然語言,由識別后的語音作為控制信號可以應用在不同的領域。
目前,語音識別通常采用在線方式,用戶輸入的語音信息由網(wǎng)絡傳入云端,經云端的服務器進行識別并將結果傳回給用戶。
但是,這種在線方式需要依賴網(wǎng)絡。
發(fā)明內容
本發(fā)明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發(fā)明的一個目的在于提出一種語音識別方法,該方法可以不依賴網(wǎng)絡實現(xiàn)語音識別。
本發(fā)明的另一個目的在于提出一種語音識別裝置。
為達到上述目的,本發(fā)明第一方面實施例提出的語音識別方法,包括:采集用戶輸入的語音信息;對所述語音信息進行特征提取,得到特征信息;根據(jù)預先獲取的聲學模型和語言模型,對所述特征信息進行解碼,得到識別后的語音信息,其中,所述聲學模型為預先進行數(shù)據(jù)壓縮后得到的。
本發(fā)明第一方面實施例提出的語音識別方法,通過離線的方式進行語音識別,可以不需要依賴網(wǎng)絡實現(xiàn)語音識別,方便用戶使用。并且,通過對聲學模型進行預先數(shù)據(jù)壓縮,可以使得聲學模型適應于移動設備中,以實現(xiàn)在移動設備離線完成語音識別。
為達到上述目的,本發(fā)明第二方面實施例提出的語音識別裝置,包括:采集模塊,用于采集用戶輸入的語音信息;提取模塊,用于對所述語音信息進行特征提取,得到特征信息;解碼模塊,用于根據(jù)預先獲取的聲學模型和語言模型,對所述特征信息進行解碼,得到識別后的語音信息,其中,所述聲學模型為預先進行數(shù)據(jù)壓縮后得到的。
本發(fā)明第二方面實施例提出的語音識別裝置,通過離線的方式進行語音識別,可以不需要依賴網(wǎng)絡實現(xiàn)語音識別,方便用戶使用。并且,通過對聲學模型進行預先數(shù)據(jù)壓縮,可以使得聲學模型適應于移動設備中,以實現(xiàn)在移動設備離線完成語音識別。
為達到上述目的,本發(fā)明第三方面實施例提出的移動設備,包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內部,處理器和存儲器設置在電路板上;電源電路,用于為移動設備的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼對應的程序,以用于執(zhí)行以下步驟:采集用戶輸入的語音信息;對所述語音信息進行特征提取,得到特征信息;根據(jù)預先獲取的聲學模型和語言模型,對所述特征信息進行解碼,得到識別后的語音信息,其中,所述聲學模型為預先進行數(shù)據(jù)壓縮后得到的。
本發(fā)明第三方面實施例提出的移動設備,通過離線的方式進行語音識別,可以不需要依賴網(wǎng)絡實現(xiàn)語音識別,方便用戶使用。并且,通過對聲學模型進行預先數(shù)據(jù)壓縮,可以使得聲學模型適應于移動設備中,以實現(xiàn)在移動設備離線完成語音識別。
本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1為本發(fā)明一實施例提出的語音識別方法的流程示意圖;
圖2為本發(fā)明實施例中離線方式的語音識別的流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網(wǎng)絡技術(北京)有限公司,未經百度在線網(wǎng)絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410129541.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





