日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種音頻數據標注方法、裝置及系統有效

專利信息
申請號: 202010147984.1 申請日: 2020-03-05
公開(公告)號: CN111341305B 公開(公告)日: 2023-09-26
發明(設計)人: 孫澤明;齊欣;王寧;張旭華;朱林林 申請(專利權)人: 蘇寧云計算有限公司
主分類號: G10L15/06 分類號: G10L15/06;G10L15/05;G10L15/18;G10L15/22;G10L15/26
代理公司: 北京市萬慧達律師事務所 11111 代理人: 陳怡
地址: 210000 江蘇省南*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 音頻 數據 標注 方法 裝置 系統
【說明書】:

發明公開了一種音頻數據標注方法、裝置及系統。方法包括:將待標注音頻數據利用語音識別引擎進行語音識別獲得參考標注文本;由待標注音頻數據解碼獲得的詞圖網絡中查找與參考標注文本編輯距離最短的最優識別路徑,計算最優識別路徑上各單詞的置信度,將各單詞的置信度與預設的第一置信度條件對比,輸出最優識別路徑上滿足第一置信度條件的目標單詞;按照詞圖網絡中各單詞的時間參數對齊目標單詞,形成待標注音頻數據的標注文本。本發明將待標注音頻數據的詞圖網絡中的單詞按照置信度做區分,將置信度高的單詞提取出來形成待標注音頻數據的標注文,本并標記置信度低的單詞,自動完成音頻數據標注,提高了標注效率,提高了標注的準確度。

技術領域

本發明涉及語音識別技術領域,特別涉及一種音頻數據標注方法、裝置及系統。

背景技術

語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述語言的技術,其所要解決的技術問題是讓計算機將語音轉化成文本,對給定的波形序列得到相應的單詞或者字符序列,本質上是信道解碼和模式識別的問題。

一般來講,語音識別系統主要由前端處理、聲學模型、語言模型和解碼器四個模塊組成。其中前端處理主要包括:端點檢測、降噪、特征提取三個方面的操作。聲學模型、語言模型和解碼器屬于后端處理,聲學模型主要用來構建輸入語音和輸出聲學單元之間的概率映射關系,語言模型主要用來描述不同字詞之間的概率搭配關系,使識別出的句子更通順自然。

語音識別系統構建的過程整體上包括:訓練和識別兩部分。訓練是指對聲學模型和語言模型的訓練,一般離線進行。識別為將用戶的語音識別為文本的過程,一般在線進行。在對聲學模型的訓練中需要大量的樣本標注音頻數據,該數據的獲取主要通過人工完成,耗時耗力,成本高昂。而直接采用語音識別后的標注音頻數據作為聲學模型的訓練樣本,由于語音識別出的標注音頻數據質量不穩定,會導致使用其作為樣本訓練出的聲學模型的準確度不高的問題。

發明內容

為了解決現有技術的問題,本發明實施例提供了一種音頻數據標注方法、裝置及系統。所述技術方案如下:

第一方面,提供了一種音頻數據標注方法,所述方法包括:

將待標注音頻數據利用語音識別引擎進行語音識別獲得參考標注文本;

以所述參考標注文本為參照,在由所述待標注音頻數據解碼獲得的詞圖網絡中查找與所述參考標注文本編輯距離最短的最優識別路徑,計算所述最優識別路徑上各單詞的置信度,將各單詞的所述置信度與預設的第一置信度條件對比,輸出所述最優識別路徑上滿足所述第一置信度條件的目標單詞;

按照所述詞圖網絡中各單詞的時間參數對齊所述目標單詞,形成所述待標注音頻數據的標注文本。

進一步地,所述詞圖網絡的獲得方法包括:

利用已標注音頻數據訓練聲學模型,根據所述參考標注文本構建有偏語言模型;

利用發音詞典連接訓練后的所述聲學模型和所述有偏語言模型,形成解碼網絡;

利用所述解碼網絡解碼所述待標注音頻數據獲得所述詞圖網絡。

進一步地,所述有偏語言模型的構建方法包括:

以句子為單元將所述參考標注文本分成N個簇,建立所述簇和相應音頻數據的映射;

為每個簇構建一個語言模型。

進一步地,所述詞圖網絡為混淆網絡。

進一步地,在獲得參考標注文本之前所述方法還包括:

獲取音頻素材的時長;

將所述音頻素材的時長與預設的時長條件對比,刪除不滿足所述時長條件的所述音頻素材;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云計算有限公司,未經蘇寧云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010147984.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美极品少妇xx高潮| 欧美亚洲精品suv一区| 日韩中文字幕一区二区在线视频 | 欧美日韩综合一区| 亚洲欧美日韩一级| 91麻豆精品国产91久久久久| 免费看性生活片| 午夜影院91| 99国产午夜精品一区二区天美| 久久久中精品2020中文| 99国产精品久久久久| 亚洲精品人| 亚洲三区二区一区| 久久午夜精品福利一区二区 | 欧美国产精品久久| 欧美精选一区二区三区| 好吊妞国产欧美日韩软件大全| 国产午夜精品理论片| 国产精品久久久久久久四虎电影| 又色又爽又大免费区欧美| 国产女性无套免费看网站| 欧美日韩一二三四区| 99日韩精品视频| 国产一区二区在| 国产午夜精品理论片| 久99精品| 欧美日韩卡一卡二| 亚洲国产精品一区二区久久,亚洲午夜| 久99久精品| 一区二区在线精品| 思思久久96热在精品国产| 91婷婷精品国产综合久久| 色综合久久久久久久粉嫩| 欧美在线播放一区| 色吊丝av中文字幕| 国产精品久久久久久久久久软件| 91精品中综合久久久婷婷| 精品综合久久久久| 性生交大片免费看潘金莲| 一区精品二区国产| 狠狠色噜噜综合社区| 亚洲精品无吗| 欧美亚洲国产日韩| 欧美激情视频一区二区三区免费| 亚洲神马久久| 国产欧美精品一区二区在线播放| 99欧美精品| 国产精品一区二区av麻豆| 91精品国产高清一区二区三区 | 亚洲精品国产suv| 国产日韩一区二区三免费| 欧美一区二区三区激情| xx性欧美hd| 久久99视频免费| 国产视频在线一区二区| 国产淫片免费看| 中文字幕在线一区二区三区 | 亚洲va欧美va国产综合先锋| 欧美极品少妇| 日韩精品中文字幕一区二区三区| 国产精品理人伦一区二区三区| 国产精品视频tv| 日韩欧美中文字幕精品| 国产精品无码永久免费888| 亚洲欧美中日精品高清一区二区 | 国内揄拍国产精品| 国产精品9区| 强制中出し~大桥未久在线播放| 欧美精品一区二区三区视频| 午夜影院91| 欧美精品一区二区三区在线四季| 狠狠色噜噜狠狠狠狠奇米777| 99色精品视频| 国产精品一区久久人人爽| 国产视频一区二区视频| 国产区精品区| 精品欧美一区二区在线观看| 91亚洲欧美强伦三区麻豆 | 欧美性xxxxx极品少妇| 精品国产九九九| 最新国产一区二区| 国产一区激情|