[發明專利]用于生成語音音頻的經編輯的轉錄的方法和裝置有效
| 申請號: | 201910576724.3 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN112151024B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 任俊儒;陳昊亮 | 申請(專利權)人: | 聲音獵手公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G11B27/031 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 林強 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 語音 音頻 編輯 轉錄 方法 裝置 | ||
1.一種用于生成語音音頻的經編輯的轉錄的方法,該方法包括:
對所述語音音頻執行自動語音識別,以產生具有一個或多個令牌的轉錄;
根據多個自然語言域中的每個自然語言域對所述轉錄進行解析,以產生多個解析結果;
基于所述多個解析結果,識別與所述轉錄匹配的自然語言域;并且
根據特定于所識別的自然語言域的預定義映射,利用替換令牌來替換所述轉錄中的感興趣令牌,以生成所述語音音頻的經編輯的轉錄。
2.如權利要求1所述的方法,其中所述語音音頻將被實時更新,并且所述方法還包括:
對更新的語音音頻執行所述自動語音識別,以產生更新的轉錄;
檢測所述更新的轉錄是否包括新的令牌;并且
一旦檢測到所述更新的轉錄包括所述新的令牌時,針對所述更新的轉錄重復執行所述轉錄解析、所述自然語言域識別和所述令牌替換以生成更新的經編輯的轉錄。
3.如權利要求1所述的方法,其中所述轉錄包括多個轉錄假設,并且對所述轉錄進行解析包括:根據所述多個自然語言域中的每個自然語言域對所述多個轉錄假設進行解析。
4.如權利要求1至3中任一項所述的方法,其中所述預定義映射包括編程式映射。
5.如權利要求4所述的方法,其中所述預定義映射還包括簡單令牌替換映射,并且所述簡單令牌替換映射和所述編程式映射被分開存儲在存儲器中,并且根據所述簡單令牌替換映射的令牌替換和根據所述編程式映射的令牌替換在分開的處理線程上同時被執行。
6.如權利要求4所述的方法,其中所述預定義映射還包括簡單令牌替換映射,并且所述簡單令牌替換映射作為搜索樹被存儲在存儲器中。
7.如權利要求4所述的方法,其中所述編程式映射包括正則表達式映射。
8.如權利要求1至3中任一項所述的方法,其中所述預定義映射可編輯以在所述預定義映射中添加、修改或刪除映射條目。
9.如權利要求1至3中任一項所述的方法,其中所述預定義映射是通過網絡從自然語言理解NLU解析服務器動態獲取的。
10.如權利要求1至3中任一項所述的方法,其中所述一個或多個令牌包括:包含英文單詞的字母詞、包含漢字的語標字符、或其他類型的書寫系統的可辨別基本單元。
11.如權利要求1至3中任一項所述的方法,其中:
所述替換令牌是所述感興趣令牌的縮寫;
所述感興趣令牌是數字的文本表示,而所述替換令牌是所述數字;
所述感興趣令牌具有不雅的意思,而所述替換令牌是所述感興趣令牌的禮貌同義詞;
所述感興趣令牌是外來詞,而所述替換令牌是所述外來詞在所述語音音頻的語言環境下的同義詞;或者
所述替換令牌具有與所述感興趣令牌相同的發音,并且在所識別的自然語言域中具有比所述感興趣令牌更合適的書寫形式。
12.如權利要求1至3中任一項所述的方法,其中所述感興趣令牌和所述替換令牌用不同的字符編碼來進行編碼。
13.如權利要求1至3中任一項所述的方法,還包括:
在所述經編輯的轉錄內標記所述替換令牌,以使得能夠呈現具有可辨識的所述替換令牌的所述經編輯的轉錄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聲音獵手公司,未經聲音獵手公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910576724.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電磁元件及其制造方法
- 下一篇:業務數據的處理方法、裝置及存儲介質





