[發明專利]音頻斷句方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202210559476.3 | 申請日: | 2022-05-23 |
| 公開(公告)號: | CN114648984B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 張歡韻 | 申請(專利權)人: | 深圳華策輝弘科技有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/18 |
| 代理公司: | 深圳中細軟知識產權代理有限公司 44528 | 代理人: | 徐春祺 |
| 地址: | 518000 廣東省深圳市福田區福田街道崗廈社區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 斷句 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種音頻斷句方法,其特征在于,所述方法包括:
將多個按序排列的語句中的首個語句作為第一待分析語句,判斷所述第一待分析語句的語義完整性,所述多個按序排列的語句為對多個按序排列的音頻片段進行語音識別得到,所述多個按序排列的音頻片段為對目標音頻分割得到;
在所述第一待分析語句的語義完整的情況下,將所述第一待分析語句放入待輸出區域,并將所述第一待分析語句的下一語句作為第二待分析語句,判斷所述第二待分析語句的語義完整性;
在所述第二待分析語句的語義不完整的情況下,將所述第二待分析語句與所述待輸出區域中的語句進行合并得到第一合并語句,判斷所述第一合并語句的語義完整性;
在所述第一合并語句的語義不完整的情況下,輸出并清空所述待輸出區域中的語句,將所述第二待分析語句的下一語句與所述第二待分析語句進行合并得到第二合并語句,并將所述第二合并語句作為所述第一待分析語句,執行所述判斷所述第一待分析語句的語義完整性的步驟,直至所述多個按序排列的語句均被輸出。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
在所述第一合并語句的語義完整的情況下,清空所述待輸出區域中的語句,將所述第一合并語句放入所述待輸出區域,并將所述第二待分析語句的下一個語句作為所述第二待分析語句,執行所述判斷所述第二待分析語句的語義完整性的步驟,直至所述多個按序排列的語句均被輸出。
3.根據權利要求1所述的方法,其特征在于,所述方法還包括:
在所述第二待分析語句的語義完整的情況下,輸出所述待輸出區域中的語句,將所述第二待分析語句放入所述待輸出區域,并將所述第二待分析語句的下一個語句作為所述第二待分析語句,執行所述判斷所述第二待分析語句的語義完整性的步驟,直至所述多個按序排列的語句均被輸出。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
在所述第一待分析語句的語義不完整的情況下,將所述第一待分析語句與所述第一待分析語句的下一語句合并得到第三合并語句,將所述第三合并語句作為所述第一待分析語句,執行所述判斷所述第一待分析語句的語義完整性的步驟。
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
若所述第二合并語句的語句長度達到預設語句長度,則將所述第二合并語句放入所述待輸出區域,并將第三待分析語句作為所述第二待分析語句,執行所述判斷所述第二待分析語句的語義完整性的步驟,直至所述多個按序排列的語句均被輸出;所述第三待分析語句為所述第二待分析語句的下一語句的下一語句。
6.根據權利要求1所述的方法,其特征在于,所述將多個按序排列的語句中的首個語句作為第一待分析語句之前,包括:
獲取所述目標音頻,并識別所述目標音頻中的靜默音;
根據所述靜默音對所述目標音頻進行分割,得到所述多個按序排列的音頻片段;
對所述多個按序排列的音頻片段進行文字識別,得到多個按序排列的語句。
7.根據權利要求1所述的方法,其特征在于,通過預設語義完整模型判斷目標語句的語義完整性,所述目標語句為所述第一待分析語句、所述第二待分析語句或合并得到的語句,所述通過預設語義完整模型判斷目標語句的語義完整性,包括:
獲取所述目標語句對應的字向量、句向量和位置向量;
根據所述字向量、所述句向量以及所述位置向量,得到所述目標語句對應的編碼序列;
將所述編碼序列輸入至預設語義完整模型,以得到所述目標語句的完整性概率;
根據所述完整性概率,確定所述目標語句的語義完整性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華策輝弘科技有限公司,未經深圳華策輝弘科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210559476.3/1.html,轉載請聲明來源鉆瓜專利網。





