[發明專利]用于序列標注的自動單元選擇和目標分解的系統和方法有效
| 申請號: | 201810160192.0 | 申請日: | 2018-02-26 |
| 公開(公告)號: | CN108510983B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 劉海容;朱臻垚;桑吉夫·薩西斯 | 申請(專利權)人: | 百度(美國)有限責任公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L19/04;G10L13/08;G10L25/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 馬曉亞;王艷春 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 序列 標注 自動 單元 選擇 目標 分解 系統 方法 | ||
本文中描述了用于序列標注的自動單元選擇和目標分解的系統和方法。實施例包括一種新的損失函數,被稱為Gram鏈結式時間分類算法(CTC)損失函數,這種損失函數擴展了流行的CTC損失函數標準以減輕以前的限制。在保留CTC優勢的同時,Gram?CTC自動學習最佳的基本單元(構詞)集,以及最適合的目標序列分解。與CTC不同的是,Gram?CTC的實施例允許模型在每個時間步輸出可變數量的字符,這使得模型能夠捕獲更長期的依賴性并提高計算效率。還表明,Gram?CTC的實施例在多種數據規模下的大型詞匯表語音識別任務方面的性能和效率方面均改進了CTC,并且采用Gram?CTC的實施例的系統能夠在標準語音基準上表現優于現有技術。
相關申請的交叉引用
本申請根據美國法典第35條119(e)款要求于2017年2月24日提交的、標題為“用于序列標注的自動單元選擇和目標分解的系統和方法(SYSTEMS AND METHODS FORAUTOMATIC UNIT SELECTION AND TARGET DECOMPOSITION FOR SEQUENCE LABELING)”、將Hair Hair Liu、Zhenyao Zhu和Sanjeev Satheesh列為發明人的、美國臨時專利申請序列號為62/463,503(案卷號28888-2107P)的文獻的優先權。上述專利文獻的全部內容通過引用并入本文。
技術領域
本公開總體上涉及可以提供改進的計算機性能、特征和用途的用于計算機學習的系統和方法。
背景技術
計算設備在人們的生活中扮演著越來越復雜和不可或缺的角色。有趣的是,盡管計算設備執行實質上更復雜和不同的任務,但是外行人員使用這樣的計算設備所需的技能水平往往變得更簡單,從而使得它們更容易為普通人群使用。為了實現提供復雜服務但以易于使用的方式提供這些服務的計算設備,要求計算設備變得更加智能。提高計算設備的學習能力,使得其能夠提供更穩健的服務,并為人們提供更容易、更直觀的方式與計算設備進行交互。
已配置計算設備學習的一個任務是序列預測任務。大多數現有的序列標注模型依賴于將目標序列固定分解成一系列基本單元。這些方法至少有兩個主要的缺點:1)基本單元的集合是固定的,諸如語音識別中的單詞、字符或音素的集合;和2)目標序列的分解是固定的。這些缺點通常導致建模序列的次優性能。
因此,所需要的是允許自動單元選擇和目標分解以供序列標注的系統和方法,通過這些系統和方法改進了計算設備的功能和用途。這樣的系統和方法可以用于提供或改進計算設備服務,舉例來說,諸如自動語音識別(ASR)、手寫識別、機器翻譯和圖像描述,這進而有助于改進計算設備的性能、用途以及與其的交互。
發明內容
本公開的實施方式提供用于訓練用于語音轉錄的轉錄模型的計算機實現的方法、訓練用于語音轉錄的循環神經網絡(RNN)模型的計算機實現的方法和包括一個或多個指令序列的非臨時性計算機可讀介質或媒質。
在本公開的一個方面中,訓練用于語音轉錄的轉錄模型的計算機實現的方法包括:將一系列話語輸入到所述轉錄模型中,其中所述一系列話語和相關聯的標簽采樣自訓練集;建立包括一元構詞和高階構詞的構詞集;采用跨步來處理輸入的一系列話語,其中步長大小取決于所述構詞集的最大構詞;從所述轉錄模型為所述一系列話語中的每個話語預測一個或多個單元,所述一個或多個單元選自建立的構詞集;以及實施Gram鏈結式時間分類算法(Gram-CTC)損失函數以測量針對給定所述相關聯的標簽的每個話語所預測的一個或多個單元的誤差,所述Gram-CTC損失函數自動選擇有用的構詞并用所選擇的構詞分解所述輸入的一系列話語,所述Gram-CTC損失函數的實施涉及正向反向轉換;計算所述損失函數相對于所述轉錄模型的參數的導數;以及使用所述導數通過反向傳播來更新所述轉錄模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度(美國)有限責任公司,未經百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810160192.0/2.html,轉載請聲明來源鉆瓜專利網。





