[發明專利]語音識別處理方法、裝置、設備及系統在審
| 申請號: | 202110321293.3 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113035174A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 郭莉莉;龍海;柳楊 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/16 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 姚璐華 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 處理 方法 裝置 設備 系統 | ||
本申請提出了一種語音識別處理方法、裝置、設備及系統,對于不同語音采集設備直接采集到的原始語音信號,本申請均可以先對其包含的原始語音特征進行調整,得到更適配語音識別模型的待識別語音信號后,再輸出至語音識別模型進行識別處理,即可保證所得相應原始語音信號的語音識別結果的高精準度,且不需要針對應用于不同場景下的各設備安裝的語音識別引擎,訓練與該應用場景下的設備相適配的語音識別模型,極大減小了模型訓練成本。
技術領域
本申請主要涉及語音識別領域,更具體地說是涉及一種語音識別處理方法、裝置、設備及系統。
背景技術
近年來,隨著語音識別技術的發展,已被普遍應用到如工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等多個領域,通常是利用語音識別引擎,對采集到原始語音信號進行識別,由電子設備響應該識別結果,滿足應用需求。
然而,在實際應用中,由于不同電子設備具有的語音采集器的性能可能不同,使其采集到的同一聲源的原始語音信號的屬性特征會有較大差異,這樣,若該不同電子設備使用同一語音識別引擎,對采集到的相應原始語音信號進行識別,可能會導致對某些電子設備采集到的原始語音信號的識別精度較低,無法滿足應用需求。
發明內容
有鑒于此,本申請提供了一種語音識別處理方法,所述方法包括:
獲取原始語音信號;
調整所述原始語音信號的原始語音特征,得到待識別語音信號;其中,所述待識別語音信號與所述原始語音信號的相似度大于第一相似閾值;
輸出所述待識別語音信號,所述待識別語音信號用于被語音識別引擎識別,得到所述原始語音信號的語音識別結果。
在一些實施例中,所述調整所述原始語音信號的原始語音特征,得到待識別語音信號,包括以下至少一種特征調整方式:
對所述原始語音信號進行信道增益補償,得到待識別語音信號;
將特定噪聲信號添加至所述原始語音信號,得到待識別語音信號;
調整所述原始語音信號的傳輸速率,得到待識別語音信號;
調用混響處理函數,向所述原始語音信號添加混響,得到待識別語音信號;
確定所述原始語音信號的掩蔽語音區域,利用預設掩蔽信號對所述掩蔽去語音區域的所述原始語音信號進行掩蔽處理,得到待識別語音信號;
其中,采用不同所述特征調整方式得到的各待識別語音信號之間的相似度大于第二相似閾值。
在一些實施例中,所述對所述原始語音信號進行信道增益補償,得到待識別語音信號,包括:
將所述原始語音信號轉換為原始時域信號或原始頻域信號;
調整所述原始時域信號或所述原始頻域信號的特征參數;
對具有調整后的所述特征參數的所述原始時域信號或所述原始頻域信號進行轉換處理,得到待識別語音信號。
在一些實施例中,所述方法還包括:
按照預設規則,確定針對所述原始語音信號的原始語音特征的目標特征調整方式;
所述調整所述原始語音信號的原始語音特征,得到待識別語音信號包括:
按照所述目標特征調整方式,調整所述原始語音信號的原始語音特征,得到待識別語音信號。
在一些實施例中,所述調整所述原始語音信號的原始語音特征,得到待識別語音信號,包括:
將所述原始語音信號輸入歸一化處理模型,實現原始語音特征的調整,得到待識別語音信號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110321293.3/2.html,轉載請聲明來源鉆瓜專利網。





