[發明專利]語音識別方法和裝置有效
| 申請號: | 201511000520.3 | 申請日: | 2015-12-28 |
| 公開(公告)號: | CN105679314B | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 程強;蔣正翔;萬廣魯 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/065;G10L15/22;G10L15/34 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
本發明提出一種語音識別方法和裝置,該語音識別方法包括:接收待識別的語音信號;確定所述語音信號屬于的領域;后臺切換為所述領域對應的語音識別模型,并采用所述語音識別模型對所述語音信號進行語音識別。該方法能夠提高語音識別的準確度。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音識別方法和裝置。
背景技術
語音識別可以將語音識別為文字。在語音識別時,通常是根據語音識別模型對輸入的語音信號進行識別,得到識別結果。相關技術中,會針對每個產品需求建立對應的識別后臺,由于每個產品可能涉及多個領域,因此每個識別后臺里面包含了多個模型,每次待識別的語音信號由這多個模型共同處理最后決定結果。但是,這種方式多余的模型可能會造成干擾,例如,無法有效區分“北京”或“背景”。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種語音識別方法,該方法可以提高語音識別的準確度。
本發明的另一個目的在于提出一種語音識別裝置。
為達到上述目的,本發明第一方面實施例提出的語音識別方法,包括:接收待識別的語音信號;確定所述語音信號屬于的領域;后臺切換為所述領域對應的語音識別模型,并采用所述語音識別模型對所述語音信號進行語音識別。
本發明第一方面實施例提出的語音識別方法,通過確定待識別的語音信號屬于的領域,并采用對應領域的語音識別模型對語音信號進行語音識別,可以在語音信號屬于不同領域時,動態切換采用的語音識別模型,相對于固定的語音識別模型的方式,可以提高精準性,從而提高語音識別的準確度。
為達到上述目的,本發明第二方面實施例提出的語音識別裝置,包括:接收模塊,用于接收待識別的語音信號;確定模塊,用于確定所述語音信號屬于的領域;第一識別模塊,用于將后臺切換為所述領域對應的語音識別模型,并采用所述語音識別模型對所述語音信號進行語音識別。
本發明第二方面實施例提出的語音識別裝置,通過確定待識別的語音信號屬于的領域,并采用對應領域的語音識別模型對語音信號進行語音識別,可以在語音信號屬于不同領域時,動態切換采用的語音識別模型,相對于固定的語音識別模型的方式,可以提高精準性,從而提高語音識別的準確度。
本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1是本發明一實施例提出的語音識別方法的流程示意圖;
圖2是本發明另一實施例提出的語音識別方法的流程示意圖;
圖3是本發明另一實施例提出的語音識別方法的流程示意圖;
圖4是本發明實施例中訓練階段及識別階段的示意圖;
圖5是本發明另一實施例提出的語音識別方法的流程示意圖;
圖6是本發明另一實施例提出的語音識別裝置的結構示意圖;
圖7是本發明另一實施例提出的語音識別裝置的結構示意圖。
具體實施方式
下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發明,而不能理解為對本發明的限制。相反,本發明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201511000520.3/2.html,轉載請聲明來源鉆瓜專利網。





