[發明專利]語音處理方法和裝置、用于語音處理的裝置有效

申請號：	201710198186.X	申請日：	2017-03-29
公開（公告）號：	CN106971723B	公開（公告）日：	2021-02-12
發明（設計）人：	牛露云;李洋;周麒麟	申請（專利權）人：	北京搜狗科技發展有限公司
主分類號：	G10L15/30	分類號：	G10L15/30;G10L15/26
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	劉祥景
地址：	100084 北京市海淀區中關***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音處理方法裝置用于
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音處理方法，其特征在于，包括：

在針對語音流進行一次語音轉寫后，依據服務器針對所述語音流中語音數據包返回的處理結果，從所述語音流中語音數據包中，獲取需要重新轉寫的目標語音數據包；其中，不同語音數據包對應相同的時間長度；所述處理結果包括：語音識別結果和/或錯誤碼；所述語音識別結果為對所述語音數據包對應的語音片段進行語音識別得到；所述語音片段為利用動態的分割閾值，對所述語音數據包對應的語音信號進行分割得到；所述動態的分割閾值為依據所述語音信號所包括待分割語音信號中已經過語音活動檢測的目標語音信號的時間長度得到；目標語音信號的時間長度等級包括：第一等級和第二等級，所述第二等級對應的時間長度大于所述第一等級對應的時間長度，所述第二等級對應的分割閾值小于所述第一等級對應的分割閾值；

向所述服務器重新發送所述目標語音數據包，以使所述服務器對所述目標語音數據包進行語音識別；

接收所述服務器針對所述目標語音數據包返回的語音識別結果；

將所述目標語音數據包對應的語音識別結果補充到所述語音流對應的語音轉寫結果中。

2.根據權利要求1所述的方法，其特征在于，所述獲取需要重新轉寫的目標語音數據包，包括：

依據服務器針對所述語音流中語音數據包返回的語音識別結果，從所述語音流中語音數據包中，獲取服務器未返回語音識別結果的語音數據包，作為需要重新轉寫的目標語音數據包；或者

依據服務器針對所述語音流中語音數據包返回的錯誤碼，從所述語音流中語音數據包中，獲取錯誤碼符合預置條件的語音數據包，作為需要重新轉寫的目標語音數據包；或者

依據服務器針對所述語音流中語音數據包返回的語音識別結果和錯誤碼，從所述語音流中語音數據包中，獲取服務器未返回語音識別結果、且錯誤碼符合預置條件的語音數據包，作為需要重新轉寫的目標語音數據包。

3.根據權利要求1或2所述的方法，其特征在于，所述向所述服務器重新發送所述目標語音數據包，包括：

響應于用戶觸發的續轉指令，向所述服務器重新發送所述目標語音數據包。

4.根據權利要求3所述的方法，其特征在于，在所述獲取需要重新轉寫的目標語音數據包之后、所述向所述服務器重新發送所述目標語音數據包之前，所述方法還包括：

輸出提示信息；所述提示信息用于提示用戶所述語音流的語音識別結果缺失。

5.根據權利要求1或2所述的方法，其特征在于，所述方法還包括：