[發(fā)明專利]一種音頻識別結(jié)果的生成方法及裝置在審
| 申請?zhí)枺?/td> | 201811476124.1 | 申請日: | 2018-12-04 |
| 公開(公告)號: | CN109326292A | 公開(公告)日: | 2019-02-12 |
| 發(fā)明(設(shè)計)人: | 韓亮;韓青;葉錦宇 | 申請(專利權(quán))人: | 北京九狐時代智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王艷芬 |
| 地址: | 100000 北京市朝陽區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本數(shù)據(jù) 音頻識別 目標(biāo)音頻 輸入?yún)^(qū)域 音頻信息 自動識別 申請 頁面 展示 | ||
本申請?zhí)峁┝艘环N音頻識別結(jié)果的生成方法及裝置,其中,該方法包括一種音頻識別結(jié)果的生成方法,包括:獲取對目標(biāo)音頻信息進(jìn)行自動識別所生成的第一文本數(shù)據(jù);所述目標(biāo)音頻信息是完整音頻信息中的一部分;將第二文本數(shù)據(jù)的輸入?yún)^(qū)域、所述第一文本數(shù)據(jù)和所述目標(biāo)音頻信息的標(biāo)識在同一個展示頁面進(jìn)行展示;根據(jù)用戶在所述第二文本數(shù)據(jù)的輸入?yún)^(qū)域所輸入的第二文本數(shù)據(jù),確定目標(biāo)音頻信息的實際識別結(jié)果。本申請實施例提供的一種音頻識別結(jié)果的生成方法及裝置,可以提高音頻識別結(jié)果的生成效率。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)標(biāo)注技術(shù)領(lǐng)域,尤其是涉及一種音頻識別結(jié)果的生成方法及裝置。
背景技術(shù)
隨著聲音采集技術(shù)和互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,每天都會產(chǎn)生大量的音頻數(shù)據(jù),需要人工服務(wù)平臺對大量的音頻數(shù)據(jù)進(jìn)行處理。工作人員需要根據(jù)音頻數(shù)據(jù)和音頻識別設(shè)備識別的結(jié)果對音頻數(shù)據(jù)進(jìn)行文本形式的編輯。
目前對音頻數(shù)據(jù)以文本形式進(jìn)行編輯時,工作人員既要打開音頻播放器播放音頻數(shù)據(jù),同時又要打開文本編輯頁面在文本編輯頁面內(nèi)編輯音頻識別數(shù)據(jù),由于音頻數(shù)據(jù)、音頻識別設(shè)備識別的結(jié)果以及音頻識別數(shù)據(jù)不能同時在一個頁面內(nèi)進(jìn)行展示,工作人員需要在音頻播放器和文本編輯頁面之間反復(fù)切換,這種編輯音頻識別數(shù)據(jù)的方法浪費時間,導(dǎo)致識別效率低。
發(fā)明內(nèi)容
有鑒于此,本申請的目的在于提供一種音頻識別結(jié)果的生成方法及裝置,以提高音頻識別結(jié)果的生成效率。
第一方面,本申請實施例提供了一種音頻識別結(jié)果的生成方法,包括:
獲取對目標(biāo)音頻信息進(jìn)行自動識別所生成的第一文本數(shù)據(jù);所述目標(biāo)音頻信息是完整音頻信息中的一部分;
將第二文本數(shù)據(jù)的輸入?yún)^(qū)域、所述第一文本數(shù)據(jù)和所述目標(biāo)音頻信息的標(biāo)識在同一個展示頁面進(jìn)行展示;
根據(jù)用戶在所述第二文本數(shù)據(jù)的輸入?yún)^(qū)域所輸入的第二文本數(shù)據(jù),確定所述目標(biāo)音頻信息的實際識別結(jié)果。
結(jié)合第一方面,本申請實施例提供了第一方面的第一種可能的實施方式,其中,
所述獲取對目標(biāo)音頻信息進(jìn)行自動識別所生成的第一文本數(shù)據(jù),包括:
獲取完整音頻信息;
按照預(yù)設(shè)的截斷規(guī)則,對所述完整音頻信息進(jìn)行分段,以生成多個發(fā)音單位;
選擇所述多個發(fā)音單位中指定的一個或多個發(fā)音單位作為目標(biāo)音頻信息;
對所述目標(biāo)音頻信息進(jìn)行語音自動識別,以得到第一文本數(shù)據(jù)。
結(jié)合第一方面的第一種可能的實施方式,本申請實施例提供了第一方面的第二種可能的實施方式,其中,
所述選擇所述多個發(fā)音單位中指定的一個或多個發(fā)音單位作為目標(biāo)音頻信息,包括:
確定所述目標(biāo)音頻信息中每個發(fā)音單位的發(fā)音特征;
根據(jù)所述發(fā)音單位的發(fā)音特征,確定所述每個發(fā)音單位所對應(yīng)的發(fā)言方;
將至少一個所述發(fā)言方所對應(yīng)的發(fā)音單位組成目標(biāo)音頻信息。
結(jié)合第一方面的第二種可能的實施方式,本申請實施例提供了第一方面的第三種可能的實施方式,其中,
所述發(fā)音特征包括以下的任意一種或多種:所述發(fā)言方的聲音的音色、音量、音調(diào)以及語速。
結(jié)合第一方面的第二種可能的實施方式,本申請實施例提供了第一方面的第四種可能的實施方式,其中,
所述將所述第一文本數(shù)據(jù)、第二文本數(shù)據(jù)的輸入?yún)^(qū)域和所述目標(biāo)音頻信息的標(biāo)識在同一個展示頁面進(jìn)行展示,包括:
將多個所述目標(biāo)音頻信息的標(biāo)識按照音頻的時間順序在同一個展示頁面進(jìn)行展示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京九狐時代智能科技有限公司,未經(jīng)北京九狐時代智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811476124.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種韻律預(yù)測方法及系統(tǒng)
- 一種基于KNN技術(shù)的語料庫文本分類方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲介質(zhì)





