[發明專利]語音處理方法和裝置、用于語音處理的裝置有效
| 申請號: | 201710198186.X | 申請日: | 2017-03-29 |
| 公開(公告)號: | CN106971723B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 牛露云;李洋;周麒麟 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G10L15/30 | 分類號: | G10L15/30;G10L15/26 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 劉祥景 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 用于 | ||
1.一種語音處理方法,其特征在于,包括:
在針對語音流進行一次語音轉寫后,依據服務器針對所述語音流中語音數據包返回的處理結果,從所述語音流中語音數據包中,獲取需要重新轉寫的目標語音數據包;其中,不同語音數據包對應相同的時間長度;所述處理結果包括:語音識別結果和/或錯誤碼;所述語音識別結果為對所述語音數據包對應的語音片段進行語音識別得到;所述語音片段為利用動態的分割閾值,對所述語音數據包對應的語音信號進行分割得到;所述動態的分割閾值為依據所述語音信號所包括待分割語音信號中已經過語音活動檢測的目標語音信號的時間長度得到;目標語音信號的時間長度等級包括:第一等級和第二等級,所述第二等級對應的時間長度大于所述第一等級對應的時間長度,所述第二等級對應的分割閾值小于所述第一等級對應的分割閾值;
向所述服務器重新發送所述目標語音數據包,以使所述服務器對所述目標語音數據包進行語音識別;
接收所述服務器針對所述目標語音數據包返回的語音識別結果;
將所述目標語音數據包對應的語音識別結果補充到所述語音流對應的語音轉寫結果中。
2.根據權利要求1所述的方法,其特征在于,所述獲取需要重新轉寫的目標語音數據包,包括:
依據服務器針對所述語音流中語音數據包返回的語音識別結果,從所述語音流中語音數據包中,獲取服務器未返回語音識別結果的語音數據包,作為需要重新轉寫的目標語音數據包;或者
依據服務器針對所述語音流中語音數據包返回的錯誤碼,從所述語音流中語音數據包中,獲取錯誤碼符合預置條件的語音數據包,作為需要重新轉寫的目標語音數據包;或者
依據服務器針對所述語音流中語音數據包返回的語音識別結果和錯誤碼,從所述語音流中語音數據包中,獲取服務器未返回語音識別結果、且錯誤碼符合預置條件的語音數據包,作為需要重新轉寫的目標語音數據包。
3.根據權利要求1或2所述的方法,其特征在于,所述向所述服務器重新發送所述目標語音數據包,包括:
響應于用戶觸發的續轉指令,向所述服務器重新發送所述目標語音數據包。
4.根據權利要求3所述的方法,其特征在于,在所述獲取需要重新轉寫的目標語音數據包之后、所述向所述服務器重新發送所述目標語音數據包之前,所述方法還包括:
輸出提示信息;所述提示信息用于提示用戶所述語音流的語音識別結果缺失。
5.根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
在針對語音流進行一次語音轉寫的過程中,依據服務器針對語音流中語音數據包返回的處理結果,確定所述語音流對應的文本流;
響應于用戶觸發的標記添加指令,分別為所述語音流及其對應的文本流添加對應的標記。
6.根據權利要求5所述的方法,其特征在于,所述標記添加指令為通過藍牙設備觸發的標記添加指令。
7.根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
在針對語音流進行一次語音轉寫的過程中,依據服務器針對語音流中語音數據包返回的處理結果,在播放編輯界面顯示所述語音流對應的文本流;
在完成所述語音流的一次語音轉寫后,響應于用戶針對所述播放編輯界面中文本觸發的摘要處理指令,將所述摘要處理指令對應的目標文本設置為所述語音流對應文件的摘要。
8.根據權利要求7所述的方法,其特征在于,所述方法還包括:
在將所述摘要處理指令對應的目標文本設置為摘要后,跳轉至摘要界面,所述摘要界面用于顯示所述語音流對應文件的摘要。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710198186.X/1.html,轉載請聲明來源鉆瓜專利網。





