日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種音頻數據標注方法、裝置及系統有效

專利信息
申請號: 202010147984.1 申請日: 2020-03-05
公開(公告)號: CN111341305B 公開(公告)日: 2023-09-26
發明(設計)人: 孫澤明;齊欣;王寧;張旭華;朱林林 申請(專利權)人: 蘇寧云計算有限公司
主分類號: G10L15/06 分類號: G10L15/06;G10L15/05;G10L15/18;G10L15/22;G10L15/26
代理公司: 北京市萬慧達律師事務所 11111 代理人: 陳怡
地址: 210000 江蘇省南*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 音頻 數據 標注 方法 裝置 系統
【權利要求書】:

1.一種音頻數據標注方法,其特征在于,包括:

將待標注音頻數據利用語音識別引擎進行語音識別獲得參考標注文本;

以所述參考標注文本為參照,在由所述待標注音頻數據解碼獲得的詞圖網絡中查找與所述參考標注文本編輯距離最短的最優識別路徑,計算所述最優識別路徑上各單詞的置信度,將各單詞的所述置信度與預設的第一置信度條件對比,輸出所述最優識別路徑上滿足所述第一置信度條件的目標單詞;

按照所述詞圖網絡中各單詞的時間參數對齊所述目標單詞,形成所述待標注音頻數據的標注文本;

其中,所述詞圖網絡的獲得方法包括:

利用已標注音頻數據訓練聲學模型,根據所述參考標注文本構建有偏語言模型;

利用發音詞典連接訓練后的所述聲學模型和所述有偏語言模型,形成解碼網絡;

利用所述解碼網絡解碼所述待標注音頻數據獲得所述詞圖網絡。

2.如權利要求1所述的一種音頻數據標注方法,其特征在于,所述有偏語言模型的構建方法包括:

以句子為單元將所述參考標注文本分成N個簇,建立所述簇和相應音頻數據的映射;

為每個簇構建一個語言模型。

3.如權利要求1所述的一種音頻數據標注方法,其特征在于,所述詞圖網絡為混淆網絡。

4.如權利要求1~3中任意一項所述的一種音頻數據標注方法,其特征在于,在獲得參考標注文本之前所述方法還包括:

獲取音頻素材的時長;

將所述音頻素材的時長與預設的時長條件對比,刪除不滿足所述時長條件的所述音頻素材;

對所述音頻素材做語音端點檢測,刪除所述音頻素材中的無效音頻數據,得到所述待標注音頻數據。

5.如權利要求1~3中任意一項所述的一種音頻數據標注方法,其特征在于,在獲得參考標注文本時所述方法還包括:

提取所述參考標注文本中的未登錄詞,基于發音詞典對所述未登錄詞進行發音預測。

6.如權利要求1~3中任意一項所述的一種音頻數據標注方法,其特征在于,在計算所述最優識別路徑上各單詞的置信度對比后,所述方法還包括:

將各單詞的所述置信度與預設的第二置信度條件對比,對滿足所述第二置信度條件的噪音單詞做標記,以便將所述噪音單詞用于聲學模型的訓練,從而根據所述標記回避所述噪音單詞,提高訓練效果,所述第二置信度條件的閾值小于所述第一置信度條件的閾值。

7.一種用于實現權利要求1所述方法的音頻數據標注裝置,其特征在于,包括:

參考標注模塊,用于利用語音識別引擎對待標注音頻數據進行語音識別獲得參考標注文本;

解碼模塊,用于對所述待標注音頻數據解碼獲得詞圖網絡;

最優識別路徑獲取模塊,用于查找與所述參考標注文本編輯距離最短的最優識別路徑;

置信度計算模塊,用于計算所述最優識別路徑上各單詞的置信度;

目標單詞獲取模塊,用于將各單詞的所述置信度與預設的第一置信度條件對比,輸出所述最優識別路徑上滿足所述第一置信度條件的目標單詞;

時間對齊模塊,用于按照所述詞圖網絡中各單詞的時間參數對齊所述目標單詞,形成所述待標注音頻數據的標注文本。

8.如權利要求7所述的音頻數據標注裝置,其特征在于,所述裝置還包括:

噪音單詞獲取模塊,用于將各單詞的所述置信度與預設的第二置信度條件對比,對滿足所述第二置信度條件的噪音單詞做標記,所述第二置信度條件的閾值小于所述第一置信度條件的閾值。

9.一種計算機系統,其特征在于,包括:

一個或多個處理器;以及

與所述一個或多個處理器關聯的存儲器,所述存儲器用于存儲程序指令,所述程序指令在被所述一個或多個處理器讀取執行時,執行如權利要求1~6任意一項所述方法的操作。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云計算有限公司,未經蘇寧云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010147984.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩欧美多p乱免费视频| 在线电影一区二区| 日本二区在线播放| 久久国产精彩视频| 午夜理伦影院| 久久一区二区三区视频| 午夜毛片在线观看| 国产伦精品一区二区三区四区| 日韩精品一区二区三区免费观看视频| 日韩欧美国产高清91| 欧美67sexhd| 午夜影院试看五分钟| 性夜影院在线观看| 一区二区三区香蕉视频| 蜜臀久久99精品久久久久久网站| 午夜剧场a级免费| 国产欧美视频一区二区| 热久久一区二区| 国产欧美日韩精品一区二区三区| 一区二区欧美视频| 欧美亚洲精品一区二区三区| 国内偷拍一区| 日本三级香港三级| 日韩国产精品久久| 国产片91| 日韩av免费电影| 久99久视频| 亚洲精品久久久久一区二区| 99久久久国产精品免费调教网站| 欧美久久一区二区三区| 欧美亚洲视频一区| 91制服诱惑| 日韩久久精品一区二区| 国产一区二区伦理片| 久久人91精品久久久久久不卡| 亚洲精品www久久久| 亚洲欧洲日韩| 久久久久久亚洲精品中文字幕| 色妞妞www精品视频| 日韩中文字幕在线一区| 亚洲码在线| 国产二区视频在线播放| 国产精品欧美一区二区三区| 亚洲区日韩| 国产欧美日韩在线观看| 国产视频在线一区二区| 午夜激情影院| 国产在线精品一区二区在线播放| 国产日韩欧美色图| 99国产精品一区二区| 国产精品乱战久久久| 免费高潮又黄又色又爽视频| 91精品视频一区二区三区| 精品国产乱码久久久久久久久 | 国产1区2| 国产一级一区二区| 在线电影一区二区| 国产精品视频一区二区在线观看 | 久久99精品久久久噜噜最新章节| 一区二区三区四区视频在线| 日本一区二区三区在线视频| 亚洲少妇中文字幕| 午夜电影院理论片做爰| 欧美日韩一区视频| 国产一级精品在线观看| 99久久国产综合精品麻豆| 久久激情网站| 亚洲乱在线| 色婷婷精品久久二区二区我来| 狠狠色狠狠色合久久伊人| 狠狠躁夜夜| 午夜国内精品a一区二区桃色| 91av一区二区三区| 国产人伦精品一区二区三区| 欧美乱妇高清无乱码| 国产一级片大全| 99久久精品一区二区| 美女被羞羞网站视频软件| 亚洲欧洲日韩av| 午夜国产一区二区| 97视频久久久| 一区精品二区国产|