[發明專利]多加權有限狀態轉換器合并方法、裝置、設備及存儲介質有效
| 申請號: | 201810713056.X | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN108962271B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 李忠杰 | 申請(專利權)人: | 廣州視源電子科技股份有限公司 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16;G10L15/06 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 510530 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 加權 有限 狀態 轉換器 合并 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種多加權有限狀態轉換器合并方法、裝置、設備及存儲介質,該方法包括獲取至少兩個初始加權有限狀態轉換器,在目標加權有限狀態轉換器增加新中間節點和新前向邊,其中,新中間節點和新前向邊用于建立新起始節點和新終止節點之間的路徑,新中間節點和新前向邊由初始加權有限狀態轉換器的節點和前向邊確定,添加每條新前向邊的代價,新前向邊的代價是初始加權有限狀態轉換器前向邊的代價的加權值,解決了多場景、多領域的語音識別中生成大型加權有限狀態轉換器帶來的低效和耗費時間的問題,達到合并過程快速、節省時間且保證準確率的技術效果。
技術領域
本發明實施例涉及語音識別技術,尤其涉及一種多加權有限狀態轉換器合并方法、裝置、設備及存儲介質。
背景技術
在移動互聯網及萬物互聯的大背景下,語音識別作為一種人機交互手段正在起著舉足輕重的作用,其被廣泛應用于生活中。
加權有限狀態轉換器(Weighted Finite-State Transducers,WFST)作為一種目前較為成熟的技術,被廣泛用于語音識別領域。WFST在語音識別的過程中作為一種解碼器,可以是根據訓練好的HMM聲學模型、語言模型及字典建立的一個識別網絡,也可以是語言模型及字典建立的一個識別網絡。發明人在實現本發明的過程中,發現現有技術存在如下的缺陷:由于每個語音識別解碼器引擎在進行語音識別操作時只對一個WFST進行搜索,而一般一個WFST對應解決一個場景或一個領域的語音識別問題,因而在解決多場景、多領域的語音識別問題時,只能通過合并多個領域或多個場景的WFST合并成一個大型WFST,但把WFST做的極其龐大,需要消耗極大的系統資源。而且多個WFST在進行合并時,需要進行復雜的優化操作,特別是對于大型WFST,需要耗費更多的時間。
發明內容
本發明提供一種多加權有限狀態轉換器合并方法、裝置、設備及存儲介質,以解決多場景、多領域的語音識別中生成大型加權有限狀態轉換器帶來的低效和耗費時間的問題。
第一方面,本發明實施例提供了多加權有限狀態轉換器合并方法,該方法包括:
獲取至少兩個初始加權有限狀態轉換器,其中,所述初始加權有限狀態轉換器包括節點和前向邊,所述節點包括起始節點、中間節點和終止節點;
建立目標加權有限狀態轉換器的新起始節點和新終止節點;
在所述目標加權有限狀態轉換器增加新中間節點和新前向邊,其中,所述新中間節點和新前向邊用于建立所述新起始節點和新終止節點之間的路徑,所述新中間節點和新前向邊由所述初始加權有限狀態轉換器的節點和前向邊確定;
添加每條所述新前向邊的代價,所述新前向邊的代價是所述初始加權有限狀態轉換器前向邊的代價的加權值。
可選的,在所述目標加權有限狀態轉換器增加新中間節點和新前向邊,包括:
在所述新起始節點后增加新中間節點和新前向邊,其中,新中間節點和新前向邊所形成的路徑與所述初始加權有限狀態轉換器的第一節點和前向邊所形成的路徑結構相同,所述第一節點為所述初始加權有限狀態轉換器的中間節點;
將指向所述終止節點的前向邊所對應的所述新前向邊指向新終止節點。
可選的,在所述目標加權有限狀態轉換器增加新中間節點和新前向邊,包括:
獲取一個所述初始加權有限狀態轉換器作為當前初始加權有限狀態轉換器;
在所述新起始節點后增加新中間節點和新前向邊,其中,新中間節點和新前向邊所形成的路徑與所述當前初始加權有限狀態轉換器的第二節點和前向邊所形成的路徑結構相同,所述第二節點為所述當前初始加權有限狀態轉換器的中間節點和終止節點;
增加從所述終止節點所對應的新中間節點出發且指向所述新終止節點的第一前向邊,所述第一前向邊執行空操作;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州視源電子科技股份有限公司,未經廣州視源電子科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810713056.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:解碼方法、解碼裝置以及記錄介質
- 下一篇:拾音方法和系統





