[發明專利]基于人工智能的語音處理方法及裝置有效
| 申請號: | 201611246698.0 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106710606B | 公開(公告)日: | 2019-11-08 |
| 發明(設計)人: | 王知踐;錢勝 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L19/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解碼 語音包 結果識別 人工智能 聲學模型 語音處理 靜音幀 跳過 冗余 | ||
1.一種基于人工智能的語音處理方法,其特征在于,包括:
利用聲學模型對待解碼的語音包中的當前幀進行打分;
根據打分結果識別當前幀是否為準靜音幀;
如果識別出當前幀為準靜音幀,在解碼時跳過當前幀,不對當前幀進行解碼;
其中,所述根據打分結果識別當前幀是否為準靜音幀,包括:
根據所述打分結果獲取當前幀的最優隱狀態和次優隱狀態;
當所述最優隱狀態對應的狀態標識為空白標識時,獲取所述最優隱狀態和所述次優隱狀態之間的得分差值;
如果所述得分差值大于預設的閾值,則識別出當前幀為準靜音幀;
利用第一標志位標記當前幀,其中,所述第一標志位用于指示出在解碼時不需要對當前幀進行解碼。
2.根據權利要求1所述的基于人工智能的語音處理方法,其特征在于,還包括:
如果所述得分差值小于或者等于所述閾值,則識別出當前幀為偽靜音幀;
利用第二標志位標記當前幀,其中,所述第二標志位用于指示出在解碼時需要對當前幀進行解碼。
3.根據權利要求2所述的基于人工智能的語音處理方法,其特征在于,還包括:
當所述最優隱狀態對應的狀態標識為非空白標識時,識別出當前幀為語音幀;
利用所述第二標志位標記當前幀。
4.根據權利要求3所述的基于人工智能的語音處理方法,其特征在于,所述利用聲學模型對待解碼的語音包中的當前幀進行打分,包括:
判斷與當前幀相鄰的前一幀是否為語音幀;
如果判斷結果為所述前一幀為語音幀,利用所述第二標志位標記當前幀;
如果判斷結果為所述前一幀非語音幀,則利用所述聲學模型對當前幀進行打分。
5.根據權利要求4所述的基于人工智能的語音處理方法,其特征在于,所述當所述最優隱狀態對應的標識為非空白標識時,識別出當前幀為語音幀之后,還包括:
獲取所述前一幀對應的標志位;
如果所述前一幀對應的標志位為所述第一標志位,則利用所述第二標志位重新標記所述前一幀。
6.根據權利要求1-5任一項所述的基于人工智能的語音處理方法,其特征在于,所述利用聲學模型對待解碼的語音包中的當前幀進行打分之前,包括:
判斷當前幀是否為所述語音包中的前三幀中的一幀;
如果判斷出當前幀為語音包中的前三幀中的一幀,利用第二標志位標記當前幀,其中,所述第二標志位指示出在解碼時需要對當前幀進行解碼;
如果判斷出當前幀非語音包中的前三幀中的一幀,判斷當前幀是否為所述語音包中的最后一幀;
如果判斷出當前幀為語音包中的最后一幀,利用所述第二標志位標記當前幀。
7.一種基于人工智能的語音處理裝置,其特征在于,包括:
打分模塊,用于利用聲學模型對待解碼的語音包中的當前幀進行打分;
識別模塊,根據打分結果識別當前幀是否為準靜音幀;
解碼模塊,用于如果識別出當前幀為準靜音幀,在解碼時跳過當前幀,不對當前幀進行解碼;
其中,所述識別模塊,包括:
第一獲取單元,用于根據所述打分結果獲取當前幀的最優隱狀態和次優隱狀態;
第二獲取單元,用于當所述最優隱狀態對應的狀態標識為空白標識時,獲取所述最優隱狀態和所述次優隱狀態之間的得分差值;
識別單元,用于如果所述得分差值大于預設的閾值,則識別出當前幀為準靜音幀;
標記單元,用于利用第一標志位標記當前幀,其中,所述第一標志位用于指示出在解碼時不需要對當前幀進行解碼。
8.根據權利要求7所述的基于人工智能的語音處理裝置,其特征在于,所述識別單元,還用于如果所述得分差值小于或者等于所述閾值,則識別出當前幀為偽靜音幀;
所述標記單元,還用于利用第二標志位標記當前幀,其中,所述第二標志位用于指示出在解碼時需要對當前幀進行解碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611246698.0/1.html,轉載請聲明來源鉆瓜專利網。





