[發明專利]一種可減少無用語音識別的語音采集處理方法及裝置在審

申請號：	201711082531.X	申請日：	2017-11-07
公開（公告）號：	CN107818793A	公開（公告）日：	2018-03-20
發明（設計）人：	劉軍;秦曉偉	申請（專利權）人：	北京云知聲信息技術有限公司
主分類號：	G10L21/02	分類號：	G10L21/02
代理公司：	北京冠和權律師事務所11399	代理人：	朱健,陳國軍
地址：	100000 北京市朝陽區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種減少無用語音識別采集處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音識別技術領域，尤其涉及一種可減少無用語音識別的語音采集處理方法及裝置。

背景技術

相關技術中，在會議場景下，會場常會擺放多個麥克風，一個人對著一個麥克風講話，系統會對每個麥克風采集的語音進行語音識別，最終形成每個人的會議發言記錄。這樣便存在一個問題：比如有三個麥克風1/2/3，對著麥克風1說話的發言者A的語音，同時會被麥克風2/3采集到，那么，麥克風2/3采集到的發言者B/C的語音中，就會夾雜A的語音，最終影響會議發言記錄的準確性。

發明內容

本發明實施例提供一種可減少無用語音識別的語音采集處理方法及裝置，用以實現確定與用戶對應的目標語音采集裝置，以在進行語音識別時提高語音識別的準確率。

根據本發明實施例的第一方面，提供一種可減少無用語音識別的語音采集處理方法，包括：

通過多個語音采集裝置采集語音信息；

分析所述多個語音采集裝置中每個語音采集裝置所采集的語音信息的強度值；

根據分析結果從所述多個語音采集裝置中選擇出語音信息強度值最高的目標語音采集裝置；

將所述目標語音采集裝置采集的第一語音信息的第一強度值進行增強處理，將所述多個語音采集裝置中其他語音采集裝置采集的第二語音信息的第二強度值進行減弱處理。

在該實施例中，在通過多個語音采集裝置采集用戶的語音信息后，分析每個語音采集裝置采集的語音信息的強度值，進而確定出強度值最高的目標語音采集裝置，從而增強該目標語音采集裝置采集的語音信息的強度值，而減弱其他語音采集裝置采集的語音信息的強度值。這樣，可以從多個語音采集裝置中篩選出正在被用戶使用的目標語音采集裝置，從而使得在進行語音識別時，不僅可以減少無用的語音識別，還可以提高語音識別的準確率。

在一個實施例中，所述分析所述多個語音采集裝置中每個語音采集裝置所采集的語音信息的強度值，包括：

計算每個語音采集裝置所采集的語音信息的強度值的平均值，得到對應的平均強度值；

計算每個語音采集裝置所采集的語音信息的平均強度值與所述多個語音采集裝置中其他所有語音采集裝置所采集的語音信息的平均強度值總和之間的差距值。

在該實施例中，可以分析每個語音采集裝置所采集的語音信息的強度值。具體的算法可以是，計算每個語音采集裝置所采集的語音信息的強度值的平均值，并將平均強度值與其他所有語音采集裝置所采集的語音信息的平均強度值總和之間的差距值，進而根據該差距值確定目標語音采集裝置。

在一個實施例中，所述根據分析結果從所述多個語音采集裝置中選擇出語音信息強度值最高的目標語音采集裝置，包括：

從所述多個語音采集裝置中選取出所述差距值大于零且所述差距值最大的語音采集裝置；

將所述差距值大于零且所述差距值最大的語音采集裝置確定為所述目標語音采集裝置。

在該實施例中，差距值最大且差距值大于零，則說明該語音采集裝置采集的語音信息的強度值最大，因此，確定其為目標語音采集裝置，進而增強其強度值，從而使得在進行語音識別時，將該語音采集裝置采集的語音信息作為主要識別依據。

在一個實施例中，所述將所述多個語音采集裝置中其他語音采集裝置采集的第二語音信息的第二強度值進行減弱處理，包括：

計算所述其他語音采集裝置中每個語音采集裝置采集的第二語音信息對應的第二強度值與預設強度閾值之間的差值；

將所述差值確定為對應的語音采集裝置采集的第二語音信息的新強度值。

在該實施例中，為避免除目標語音采集裝置外的其他語音采集裝置對語音識別造成干擾，可以減小其采集的當前語音信息的強度值，具體減弱算法可以是計算其他語音采集裝置中每個語音采集裝置采集的第二語音信息的第二強度值減去預設強度閾值，進而得到對應的新的強度值。

在一個實施例中，所述預設強度閾值包括以下任一項：

所述多個語音采集裝置對應的平均強度值的算數和均值，所述多個語音采集裝置對應的平均強度值的能量均值。

根據本發明實施例的第二方面，提供一種可減少無用語音識別的語音采集處理裝置，包括：

處理器；

用于存儲處理器可執行指令的存儲器；

其中，所述處理器被配置為：

通過多個語音采集裝置采集語音信息；

分析所述多個語音采集裝置中每個語音采集裝置所采集的語音信息的強度值；

根據分析結果從所述多個語音采集裝置中選擇出語音信息強度值最高的目標語音采集裝置；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京云知聲信息技術有限公司，未經北京云知聲信息技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711082531.X/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質量或其可識度而處理語音信號，以產生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】