[發(fā)明專利]語音識(shí)別方法、語音識(shí)別系統(tǒng)及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011420932.3 | 申請(qǐng)日: | 2020-12-08 |
| 公開(公告)號(hào): | CN114627854A | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 朱云峰;嚴(yán)秋紅;陸東明;張亮;董斌 | 申請(qǐng)(專利權(quán))人: | 中國電信股份有限公司 |
| 主分類號(hào): | G10L15/02 | 分類號(hào): | G10L15/02;G10L15/04;G10L15/26;G10L15/28;G10L25/87 |
| 代理公司: | 中國貿(mào)促會(huì)專利商標(biāo)事務(wù)所有限公司 11038 | 代理人: | 許海蘭 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識(shí)別 方法 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供語音識(shí)別方法、語音識(shí)別系統(tǒng)及存儲(chǔ)介質(zhì)。語音識(shí)別方法包括:語音流處理步驟,接收語音流,將所述語音流分割為語音幀;語音幀處理步驟,對(duì)所述語音幀進(jìn)行靜音判斷;以及語音識(shí)別步驟,根據(jù)所述靜音判斷的結(jié)果,與語音識(shí)別引擎交互消息。
技術(shù)領(lǐng)域
本發(fā)明總體上涉及語音的自動(dòng)化處理領(lǐng)域,更具體地涉及語音識(shí)別方法、語音識(shí)別系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù)
語音識(shí)別技術(shù)已經(jīng)廣泛應(yīng)用于生產(chǎn)生活的各個(gè)方面。例如,在呼叫場(chǎng)景下,實(shí)時(shí)語音識(shí)別技術(shù)的主要應(yīng)用場(chǎng)景包括但不限于智能坐席助手、實(shí)時(shí)質(zhì)檢等話務(wù)中心智能應(yīng)用的實(shí)時(shí)語音識(shí)別場(chǎng)景。實(shí)現(xiàn)這些業(yè)務(wù)場(chǎng)景的基礎(chǔ)是要利用語音識(shí)別引擎將呼叫中的主被叫語音識(shí)別為文字,作為后續(xù)業(yè)務(wù)處理模塊的輸入,并且,這些場(chǎng)景對(duì)語音識(shí)別的實(shí)時(shí)性要求比較高,基本都要做到所說即所得。呼叫場(chǎng)景是雙人對(duì)話場(chǎng)景,分為主叫與被叫,目前實(shí)現(xiàn)方式一般為一通呼叫占用兩路語音識(shí)別引擎并發(fā)能力,包括一路主叫語音及一路被叫語音。這種機(jī)制下,一路引擎支持一條語音。轉(zhuǎn)換成呼叫數(shù),語音識(shí)別引擎支持的最大呼叫數(shù)=語音識(shí)別引擎并發(fā)數(shù)/2。
在呼叫數(shù)量快速增加的情況下,對(duì)于語音識(shí)別引擎的并發(fā)數(shù)要求也更多,這對(duì)于軟硬件資源均提出了更高的要求。
發(fā)明內(nèi)容
在下文中給出了關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的一些方面的基本理解。但是,應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖用來確定本發(fā)明的關(guān)鍵性部分或重要部分,也不是意圖用來限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出關(guān)于本發(fā)明的某些概念,以此作為稍后給出的更詳細(xì)描述的前序。
在人說話時(shí),有說話和停頓兩種場(chǎng)景,對(duì)應(yīng)的語音為話音與靜音兩部分。在雙人對(duì)話場(chǎng)景,一方說話時(shí),另一方往往是傾聽狀態(tài)。呼叫場(chǎng)景也是一種雙人對(duì)話場(chǎng)景,表現(xiàn)為主叫說話的時(shí)候,被叫靜音,被叫說話的時(shí)候,主叫靜音。在目前的識(shí)別場(chǎng)景下,如果一通呼叫持續(xù)30秒,則語音識(shí)別引擎將被占用主被叫兩路語音識(shí)別時(shí)間各30秒。然而,對(duì)話中的單軌語音(主叫方、被叫方的任意一者)一般有較長(zhǎng)的靜音段,對(duì)靜音段的識(shí)別實(shí)際是語音識(shí)別引擎能力的浪費(fèi)。
本發(fā)明針對(duì)此問題,提出語音識(shí)別方法、語音識(shí)別系統(tǒng)及存儲(chǔ)介質(zhì),實(shí)現(xiàn)只將有效語音幀傳送給語音識(shí)別引擎,節(jié)省靜音段的引擎識(shí)別資源。
根據(jù)本發(fā)明的一個(gè)方面,提供一種語音識(shí)別方法,包括:語音流處理步驟,接收語音流,將所述語音流分割為語音幀;語音幀處理步驟,對(duì)所述語音幀進(jìn)行靜音判斷;以及語音識(shí)別步驟,根據(jù)所述靜音判斷的結(jié)果,與語音識(shí)別引擎交互消息。
在本發(fā)明的實(shí)施例中,還包括:識(shí)別結(jié)果處理步驟,從所述語音識(shí)別引擎獲取識(shí)別結(jié)果后,計(jì)算所述識(shí)別結(jié)果在原語音流中的時(shí)間位置。
在本發(fā)明的實(shí)施例中,在所述識(shí)別結(jié)果處理步驟中,根據(jù)所述語音識(shí)別引擎返回的時(shí)間位置及存儲(chǔ)的靜音時(shí)長(zhǎng)信息計(jì)算所述識(shí)別結(jié)果在原語音流中的時(shí)間位置。
在本發(fā)明的實(shí)施例中,在所述語音識(shí)別步驟中,與所述語音識(shí)別引擎交互消息包括新建語音識(shí)別會(huì)話、發(fā)送待識(shí)別語音幀、獲取識(shí)別結(jié)果、結(jié)束語音識(shí)別會(huì)話。
在本發(fā)明的實(shí)施例中,新建的所述語音識(shí)別會(huì)話的會(huì)話信息包括:會(huì)話標(biāo)識(shí)、語音標(biāo)識(shí)、語音的呼叫隨路信息、語音的處理位置。
在本發(fā)明的實(shí)施例中,在所述語音幀處理步驟中,通過語音端點(diǎn)檢測(cè)對(duì)所述語音幀進(jìn)行靜音判斷。
在本發(fā)明的實(shí)施例中,如果所述語音幀不是靜音幀,上一幀語音是靜音幀時(shí),新建所述語音識(shí)別會(huì)話,如果所述語音幀不是靜音幀,上一幀語音不是靜音幀時(shí),繼續(xù)進(jìn)行所述語音識(shí)別;如果所述語音幀是靜音幀,上一幀語音不是靜音幀時(shí),結(jié)束所述語音識(shí)別會(huì)話,如果所述語音幀是靜音幀,上一幀語音是靜音幀時(shí),計(jì)算靜音段時(shí)長(zhǎng)。
在本發(fā)明的實(shí)施例中,在新建所述語音識(shí)別會(huì)話時(shí),增加所述語音識(shí)別引擎的當(dāng)前并發(fā)數(shù),結(jié)束所述語音識(shí)別會(huì)話時(shí),減少所述語音識(shí)別引擎的當(dāng)前并發(fā)數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011420932.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





