[發明專利]一種將錄音音頻分割成段的方法在審

申請號：	201611037945.6	申請日：	2016-11-23
公開（公告）號：	CN106782506A	公開（公告）日：	2017-05-31
發明（設計）人：	張悅	申請（專利權）人：	語聯網（武漢）信息技術有限公司
主分類號：	G10L15/04	分類號：	G10L15/04
代理公司：	暫無信息	代理人：	暫無信息
地址：	430073 湖北省武漢市東湖***	國省代碼：	湖北;42
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種錄音音頻分割方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種將錄音音頻分割成段的方法，其特征是包括以下步驟：

獲取并遍歷錄音音頻數據，獲取語音部分和靜音部分；

設定停頓處；

根據時間分割形成若干個節點，設置節點編號；

相鄰的兩個節點之間形成段；

對節點進行修正；

所述對節點進行修正的方法是判斷節點是否屬于停頓處，如果節點不屬于停頓處，那么把節點調整至上一個停頓處；

如果節點屬于停頓處，繼續修正下一個節點直至結束；

所述靜音部分的時間為相鄰的兩個語音部分之間的時間差。

2.根據權利要求1所述的將錄音音頻分割成段的方法，其特征是所述設定停頓處的方法是，根據靜音部分的時間計算平均靜音時間，將大于平均靜音時間的閾值的靜音部分判斷為停頓處。

3.根據權利要求2所述的將錄音音頻分割成段的方法，其特征是所述根據靜音部分的時間計算平均靜音時間的步驟是，獲取靜音部分的總時長，以及靜音部分的數量，用靜音部分的總時長除以靜音部分的數量計算出平均靜音時間。

4.根據權利要求1所述的將錄音音頻分割成段的方法，其特征是所述設定停頓處的方法是，取靜音部分的時間的中位數并設定為停頓處。

5.根據權利要求1所述的將錄音音頻分割成段的方法，其特征是所述設定停頓處的方法是，由錄音者按照習慣語速錄制錄音音頻的樣本，所述錄音音頻的樣本包括一個停頓處，將錄音音頻的樣本的停頓處設定為錄音音頻的停頓處。

6.根據權利要求1所述的將錄音音頻分割成段的方法，其特征是所述修正節點的方法還包括節點前和/或節點后的字符是否與節點標簽庫中的標簽匹配，所述節點標簽庫是存儲了若干句子的段開始或段結束的詞標簽的語料庫。

7.根據權利要求1所述的將錄音音頻分割成段的方法，其特征是所述修正節點的方法還包括判斷節點的字符是否與人物更換標簽匹配，所述人物更換標簽是在錄音時根據人的聲音不同形成的用以區分的人物差異化標識符。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于語聯網（武漢）信息技術有限公司，未經語聯網（武漢）信息技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611037945.6/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】