[發明專利]一種語音信號處理方法、裝置、介質和設備在審

申請號：	202011517821.4	申請日：	2020-12-21
公開（公告）號：	CN112634868A	公開（公告）日：	2021-04-09
發明（設計）人：	陳孝良;孔德威;馮大航;常樂	申請（專利權）人：	北京聲智科技有限公司
主分類號：	G10L15/00	分類號：	G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/16;G10L19/04
代理公司：	北京同達信恒知識產權代理有限公司 11291	代理人：	萬曉君
地址：	100080 北京市海淀區北四***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音信號處理方法裝置介質設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音信號處理方法，其特征在于，所述方法包括：

確定接收到的語音信號中的至少一個語音破損片段，所述語音破損片段包括語音信號丟失片段和語音信號損失片段；

針對每個語音破損片段，合成得到該語音破損片段對應的語音信號，其中，若一個語音破損片段為語音信號丟失片段，根據該語音信號丟失片段的時長，基于該語音信號丟失片段相鄰的至少一個語音信號正常片段，合成得到該語音信號丟失片段對應的語音信號；若一個語音破損片段為語音信號損失片段，基于該語音信號損失片段，利用預先訓練出的語音合成模型，合成得到該語音信號損失片段對應的語音信號；

利用合成得到的破損語音片段對應的語音信號，替換接收到的語音信號中該破損語音片段對應的原始語音信號。

2.如權利要求1所述的方法，其特征在于，若一個語音信號丟失片段的時長小于一個音子對應的時長，基于該語音信號丟失片段相鄰的至少一個語音信號正常片段，合成得到該語音信號丟失片段對應的語音信號，包括：

確定所述語音信號中，與該語音信號丟失片段相鄰的至少一個語音信號正常片段；

將確定出的所述語音信號正常片段的每個語音幀對應的語音特征作為輸入，利用預先訓練出的特征預測模型，依次確定該語音信號丟失片段的每個語音幀對應的語音特征；

將確定出的該語音信號丟失片段的每個語音幀對應的語音特征作為輸入，利用預先訓練出的聲碼器模型，依次合成輸入的語音特征對應的語音幀對應的每個語音點。

3.如權利要求1所述的方法，其特征在于，若一個語音信號丟失片段的時長不小于一個音子對應的時長，基于該語音信號丟失片段相鄰的至少一個語音信號正常片段，合成得到該語音信號丟失片段對應的語音信號，包括：

確定所述語音信號中，與該語音信號丟失片段相鄰的至少一個語音信號正常片段；

通過自動語音識別確定所述語音信號正常片段對應的音子序列；

將確定出的所述語音信號正常片段對應的音子序列作為輸入，利用預先訓練出的語言模型，確定該語音信號丟失片段對應的音子序列；

將確定出的該語音信號丟失片段對應的音子序列作為輸入，利用預先訓練出的聲學模型，依次確定該語音信號丟失片段的每個語音幀對應的語音特征；

4.如權利要求2或3所述的方法，其特征在于，確定所述語音信號中，與該語音信號丟失片段相鄰的至少一個語音信號正常片段，包括：

確定所述語音信號中，與該語音信號丟失片段相鄰，且位于該語音信號丟失片段之前的一個語音信號正常片段。