[發明專利]語音識別文本分段方法及裝置有效

申請號：	201610256898.8	申請日：	2016-04-20
公開（公告）號：	CN107305541B	公開（公告）日：	2021-05-04
發明（設計）人：	胡尹;潘清華;王金钖;胡國平;胡郁	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G06F40/211	分類號：	G06F40/211;G06F40/30;G10L15/04;G10L15/02
代理公司：	北京維澳專利代理有限公司 11252	代理人：	劉路堯;逢京喜
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別文本分段方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音識別文本分段方法，其特征在于，包括：

對語音數據進行端點檢測，得到各語音段及各語音段的開始幀序號和結束幀序號；

對各語音段進行語音識別，得到各語音段對應的識別文本；

提取各語音段對應的識別文本的分段特征；

利用提取的分段特征以及預先構建的分段模型，對所述語音數據對應的識別文本進行分段檢測，以確定需要分段的位置，所述分段特征用于確定各所述語音段對應的識別文本的結束位置是否為分段邊界，所述分段是指劃分出段落結構；

根據分段檢測結果對所述語音數據對應的識別文本進行分段。

2.根據權利要求1所述的方法，其特征在于，所述方法還包括，按以下方式構建分段模型：

收集語音數據；

對收集的語音數據進行端點檢測，得到各語音段；

對各語音段進行語音識別，得到各語音段對應的識別文本；

標注各語音段對應的識別文本的分段信息，所述分段信息用于表示當前語音段對應的識別文本的結束位置是否需要分段；

提取各語音段對應的識別文本的分段特征；

將所述分段特征及所述分段信息作為訓練數據，構建分段模型。

3.根據權利要求1所述的方法，其特征在于，所述提取各語音段對應的識別文本的分段特征包括：

從所述語音數據的聲學上提取各語音段的分段特征，并將該分段特征作為所述語音段對應的識別文本的第一分段特征；和/或

從所述識別文本的語義上提取分段特征，并將該分段特征作為所述識別文本的第二分段特征。

4.根據權利要求3所述的方法，其特征在于，所述第一分段特征包括：當前語音段的時長，還包括：當前語音段與前一語音段之間的距離、和/或當前語音段與后一語音段之間的距離；

所述從所述語音數據的聲學上提取各語音段的分段特征包括：

計算當前語音段的結束幀序號與當前語音段的開始幀序號的差值，并將該差值作為當前語音段的時長；

還包括：

計算當前語音段的開始幀序號與前一語音段的結束幀序號的差值，并將該差值作為當前語音段與前一語音段之間的距離；和/或

計算后一語音段的開始幀序號與當前語音段的結束幀序號的差值，并將該差值作為當前語音段與后一語音段之間的距離。

5.根據權利要求4所述的方法，其特征在于，所述第一分段特征還包括：當前語音段的說話人與前一語音段的說話人是否相同、和/或當前語音段的說話人與后一語音段的說話人是否相同；

所述從所述語音數據的聲學上提取各語音段的分段特征還包括：

利用說話人分離技術對所述語音數據進行說話人變化點檢測；

根據說話人變化點檢測結果確定當前語音段的說話人與前一語音段的說話人是否相同、和/或根據說話人變化點檢測結果確定當前語音段的說話人與后一語音段的說話人是否相同。

6.根據權利要求3所述的方法，其特征在于，所述第二分段特征包括以下任意一種或多種：

前向未分段句子數，指從當前語音段對應的識別文本的開始位置到上一分段標記之間所有識別文本包含的句子總數；

后向未分段句子數，指在當前語音段對應的識別文本之后的所有識別文本包含的句子總數；

當前語音段對應的識別文本包含的句子數；

當前語音段對應的識別文本與前一語音段對應的識別文本的相似度；

當前語音段對應的識別文本與后一語音段對應的識別文本的相似度。

7.根據權利要求3所述的方法，其特征在于，所述從所述識別文本的語義上提取分段特征包括：

對所述語音數據對應的識別文本進行修正，所述修正包括：對所述語音數據對應的識別文本添加標點；

從修正后的識別文本的語義上提取分段特征。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司，未經科大訊飛股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610256898.8/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】