[發(fā)明專利]一種語音處理方法及裝置有效
申請?zhí)枺?/td> | 202110366094.4 | 申請日: | 2021-04-06 |
公開(公告)號: | CN113192488B | 公開(公告)日: | 2022-05-06 |
發(fā)明(設(shè)計)人: | 李程帥;孫進偉;徐濤 | 申請(專利權(quán))人: | 青島信芯微電子科技股份有限公司 |
主分類號: | G10L15/02 | 分類號: | G10L15/02;G06K9/62;G10L15/20;G10L15/22 |
代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 彭燕 |
地址: | 266100 山*** | 國省代碼: | 山東;37 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 語音 處理 方法 裝置 | ||
1.一種語音處理方法,其特征在于,包括:
在語音集中任意挑選一部分第一語音文件,針對每個第一語音文件,通過語音分析確定所述第一語音文件的第一有效語音及所述第一有效語音在所述第一語音文件中的位置;所述第一有效語音為來自設(shè)備外部需要通過設(shè)備進行處理的電子信號;
對各第一有效語音在各第一語音文件中的位置進行聚類,將得到的k個聚類中心作為有效語音在語音文件中的k個預(yù)測位置;
針對所述語音集中的每個第二語音文件,從所述第二語音文件在所述k個預(yù)測位置處的語音序列中,確定過零率大于預(yù)設(shè)閾值且能量最高的語音序列為所述第二語音文件的第二有效語音;所述第二語音文件為所述語音集中除所述第一語音文件之外的語音文件;
通過語音分析確定所述第一語音文件的第一有效語音及所述第一有效語音在所述第一語音文件中的位置,包括:
通過對所述第一語音文件按照設(shè)定步長進行滑窗操作,得到多個滑窗的語音序列;
將多個滑窗的語音序列的能量和/或過零率進行比較,將能量和/或過零率滿足預(yù)設(shè)條件的滑窗的語音序列確定為所述第一語音文件的第一有效語音;所述能量和/或過零率滿足預(yù)設(shè)條件的滑窗所在的位置為所述第一有效語音在所述第一語音文件中的位置。
2.如權(quán)利要求1所述的方法,其特征在于,還包括:
針對所述語音集中的任一語音文件,將所述語音文件的起始語音序列或結(jié)尾語音序列中能量最低的設(shè)定長度的窗對應(yīng)的語音序列確定為所述語音文件的噪聲語音;根據(jù)所述語音文件的有效語音和所述語音文件的噪聲語音,確定所述語音文件的信噪比。
3.如權(quán)利要求1所述的方法,其特征在于,
將能量和/或過零率滿足預(yù)設(shè)條件的滑窗的語音序列確定為所述第一語音文件的第一有效語音,包括:
將能量最高的語音序列確定為所述第一語音文件的第一有效語音;所述能量最高的語音序列對應(yīng)的滑窗為所述第一有效語音在所述第一語音文件中的位置。
4.如權(quán)利要求3所述的方法,其特征在于,
通過對所述第一語音文件進行滑窗操作,得到每個滑窗的語音序列,包括:
采用n種不同尺寸的滑窗對所述第一語音文件進行滑窗操作,得到每個滑窗的語音序列;
將能量最高的語音序列確定為所述第一語音文件的第一有效語音,包括:
針對任一種尺寸的滑窗,將能量最高的語音序列確定為所述第一語音文件的第一有效語音。
5.如權(quán)利要求3所述的方法,其特征在于,
通過如下方式確定每個滑窗的語音序列的能量:
根據(jù)第一滑窗的語音序列與第二滑窗的語音序列,通過差分方式確定所述第二滑窗的語音序列的能量;所述第二滑窗為位于所述第一滑窗之后的第一個滑窗。
6.一種語音處理裝置,其特征在于,包括:
確定單元,用于在語音集中任意挑選一部分第一語音文件,針對每個第一語音文件,通過語音分析確定所述第一語音文件的第一有效語音及所述第一有效語音在所述第一語音文件中的位置;所述第一有效語音為來自設(shè)備外部需要通過設(shè)備進行處理的電子信號;
處理單元,用于:
對各第一有效語音在各第一語音文件中的位置進行聚類,將得到的k個聚類中心作為有效語音在語音文件中的k個預(yù)測位置;
針對所述語音集中的每個第二語音文件,從所述第二語音文件在所述k個預(yù)測位置處的語音序列中,確定過零率大于預(yù)設(shè)閾值且能量最高的語音序列為所述第二語音文件的第二有效語音;所述第二語音文件為所述語音集中除所述第一語音文件之外的語音文件;
通過語音分析確定所述第一語音文件的第一有效語音及所述第一有效語音在所述第一語音文件中的位置,包括:
通過對所述第一語音文件按照設(shè)定步長進行滑窗操作,得到多個滑窗的語音序列;
將多個滑窗的語音序列的能量和/或過零率進行比較,將能量和/或過零率滿足預(yù)設(shè)條件的滑窗的語音序列確定為所述第一語音文件的第一有效語音;所述能量和/或過零率滿足預(yù)設(shè)條件的滑窗所在的位置為所述第一有效語音在所述第一語音文件中的位置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島信芯微電子科技股份有限公司,未經(jīng)青島信芯微電子科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110366094.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。