[發明專利]一種音頻識別結果的生成方法及裝置在審
| 申請號: | 201811476124.1 | 申請日: | 2018-12-04 |
| 公開(公告)號: | CN109326292A | 公開(公告)日: | 2019-02-12 |
| 發明(設計)人: | 韓亮;韓青;葉錦宇 | 申請(專利權)人: | 北京九狐時代智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王艷芬 |
| 地址: | 100000 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本數據 音頻識別 目標音頻 輸入區域 音頻信息 自動識別 申請 頁面 展示 | ||
1.一種音頻識別結果的生成方法,其特征在于,包括:
獲取對目標音頻信息進行自動識別所生成的第一文本數據;所述目標音頻信息是完整音頻信息中的一部分;
將第二文本數據的輸入區域、所述第一文本數據和所述目標音頻信息的標識在同一個展示頁面進行展示;
根據用戶在所述第二文本數據的輸入區域所輸入的第二文本數據,確定所述目標音頻信息的實際識別結果。
2.根據權利要求1所述的方法,其特征在于,包括:所述獲取對目標音頻信息進行自動識別所生成的第一文本數據,包括:
獲取完整音頻信息;
按照預設的截斷規則,對所述完整音頻信息進行分段,以生成多個發音單位;
選擇所述多個發音單位中指定的一個或多個發音單位作為目標音頻信息;
對所述目標音頻信息進行語音自動識別,以得到第一文本數據。
3.根據權利要求2所述的方法,其特征在于,所述選擇所述多個發音單位中指定的一個或多個發音單位作為目標音頻信息,包括:
確定所述目標音頻信息中每個發音單位的發音特征;
根據所述發音單位的發音特征,確定所述每個發音單位所對應的發言方;
將至少一個所述發言方所對應的發音單位組成目標音頻信息。
4.根據權利要求3所述的方法,其特征在于,所述發音特征包括以下的任意一種或多種:所述發言方的聲音的音色、音量、音調以及語速。
5.根據權利要求3所述的方法,其特征在于,所述將所述第一文本數據、第二文本數據的輸入區域和所述目標音頻信息的標識在同一個展示頁面進行展示,包括:
將多個所述目標音頻信息的標識按照音頻的時間順序在同一個展示頁面進行展示。
6.根據權利要求1所述的方法,其特征在于,所述將所述第一文本數據、第二文本數據的輸入區域和所述目標音頻信息的標識在同一個展示頁面進行展示,包括:
將不可修改的所述第一文本數據與第二文本數據的輸入區域在同一個展示頁面的不同展示區域內展示。
7.根據權利要求1所述的方法,其特征在于,所述將所述第一文本數據、第二文本數據的輸入區域和所述目標音頻信息的標識在同一個展示頁面進行展示,包括:
將所述第一文本數據在第二文本數據的輸入區域內,以可編輯的形式進行展示。
8.一種音頻識別結果的生成裝置,其特征在于,包括:獲取模塊、展示模塊和確定模塊;
所述獲取模塊,用于獲取對目標音頻信息進行自動識別所生成的第一文本數據;所述目標音頻信息是完整音頻信息中的一部分;
所述展示模塊,用于將第二文本數據的輸入區域、所述第一文本數據和所述目標音頻信息的標識在同一個展示頁面進行展示;
所述確定模塊,用于根據用戶在所述第二文本數據的輸入區域所輸入的第二文本數據,確定所述目標音頻信息的實際識別結果。
9.一種電子設備,其特征在于,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執行的機器可讀指令,當電子設備運行時,所述處理器與所述存儲器之間通過總線通信,所述機器可讀指令被所述處理器執行時執行如權利要求1至7任一所述的音頻識別結果的生成方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執行如權利要求1至7任一所述的音頻識別結果的生成方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京九狐時代智能科技有限公司,未經北京九狐時代智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811476124.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電視模式控制方法、電視及存儲介質
- 下一篇:一種文本相關的聲紋密鑰生成方法





