[發明專利]一種語音信號識別方法和裝置在審
| 申請號: | 201711241113.0 | 申請日: | 2017-11-30 |
| 公開(公告)號: | CN109859749A | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 劉勇 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/22 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 連續語音信號 語音激活檢測 指向性 標志信號 語音信號識別 方法和裝置 所述空間 音頻信號 空間音頻 申請 | ||
1.一種語音信號識別方法,其特征在于,包括:
獲取指定空間內的空間音頻信號;
根據所述空間音頻信號,從所述空間音頻信號中分離出針對多個聲源方向的連續語音信號以及相應的指向性標志信號;
針對多個聲源方向中的一個聲源方向,將針對該聲源方向的連續語音信號與相應的指向性標志信號進行組合,生成針對該聲源方向的語音激活檢測信號。
2.根據權利要求1所述的方法,其特征在于,所述空間音頻信號包括:多個麥克風采集的多路原始音頻信號;所述根據所述空間音頻信號,從所述空間音頻信號中分離出針對多個聲源方向的連續語音信號以及相應的指向性標志信號的步驟包括:
根據所述多路原始音頻信號,估計信號到達方向;
根據所述信號到達方向以及預設聲源方向,生成針對預設聲源方向的指向性標志信號;
對所述多路原始音頻信號進行波束形成處理,生成針對聲源方向的連續語音信號。
3.根據權利要求2所述的方法,其特征在于,所述對所述多路原始音頻信號進行波束形成處理,生成針對聲源方向的連續語音信號的步驟包括:
確定所述多路原始音頻信號中兩兩信號之間的時延差;
根據所述兩兩信號之間的時延差,對所述多路原始音頻信號進行時延補償;
對時延補償后的所述多路原始音頻信號進行加權求和,生成針對聲源方向的連續語音信號。
4.根據權利要求1所述的方法,其特征在于,所述針對多個聲源方向中的一個聲源方向,將針對該聲源方向的連續語音信號以及相應的指向性標志信號進行組合,生成針對該聲源方向的語音激活檢測信號的步驟包括:
確定每一幀連續語音信號對應的指向性標志信號;
逐幀判斷所述連續語音信號的每一幀為語音信號或非語音信號;
根據對每一幀連續語音信號的判斷結果,以及對應的指向性標志信號,設置每一幀連續語音信號為語音信號或非語音信號;
將每一幀連續語音信號中被設置為語音信號的信號,確定為語音激活檢測信號。
5.根據權利要求4所述的方法,其特征在于,在根據對每一幀連續語音信號的判斷結果,以及對應的指向性標志信號,設置每一幀連續語音信號為語音信號或非語音信號之后,還包括:
確定非語音片段的時長,所述非語音片段為由連續的設置為非語音信號的各幀連續語音信號所構成的片段;
將時長小于第一預設閾值的非語音片段中的每一幀連續語音信號,設置為語音信號。
6.根據權利要求4所述的方法,其特征在于,所述指向性標志信號表示了每一幀的時間是具有語音信號或具有非語音信號;所述根據對每一幀連續語音信號的判斷結果,以及對應的指向性標志信號,設置每一幀連續語音信號為語音信號或非語音信號的步驟包括:
若對當前幀的連續語音信號的判斷結果為語音信號,并且,相應的指向性標志信號為表示當前幀的時間具有語音信號,則設置當前幀的連續語音信號為語音信號。
7.根據權利要求4所述的方法,其特征在于,所述指向性標志信號表示了每一幀的時間是具有語音信號或具有非語音信號;所述根據對每一幀連續語音信號的判斷結果,以及對應的指向性標志信號,設置每一幀連續語音信號為語音信號或非語音信號的步驟包括:
若對當前幀的連續語音信號的判斷結果為語音信號,或,相應的指向性標志信號為表示當前幀的時間具有語音信號,則設置當前幀的連續語音信號為語音信號。
8.根據權利要求4所述的方法,其特征在于,所述逐幀判斷所述連續語音信號的每一幀為語音信號或非語音信號的步驟包括:
將所述連續語音信號輸入預置的神經網絡模型,逐幀判斷所述連續語音信號的每一幀為語音信號或非語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711241113.0/1.html,轉載請聲明來源鉆瓜專利網。





