[發(fā)明專利]一種語音轉(zhuǎn)寫方法、裝置、設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810516113.5 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN108845979A | 公開(公告)日: | 2018-11-20 |
| 發(fā)明(設(shè)計)人: | 高建清;王智國;胡國平;胡郁;劉慶峰 | 申請(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G10L15/26 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王雨;王寶筠 |
| 地址: | 230031 安徽*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 轉(zhuǎn)寫 文本 標(biāo)點 可讀存儲介質(zhì) 語音 停頓信息 文本表達 語義信息 語音數(shù)據(jù) 申請 | ||
本申請公開了一種語音轉(zhuǎn)寫方法、裝置、設(shè)備及可讀存儲介質(zhì),通過對獲取的語音數(shù)據(jù)進行轉(zhuǎn)寫,得到轉(zhuǎn)寫文本,根據(jù)轉(zhuǎn)寫文本的語義信息及停頓信息確定了轉(zhuǎn)寫文本內(nèi)需要添加標(biāo)點的位置并進行了標(biāo)點添加,得到的編輯后轉(zhuǎn)寫文本按照文本表達邏輯添加了標(biāo)點,基于此,該編輯后轉(zhuǎn)寫文本更加便于編輯人員理解,因此提高了編輯效率。
技術(shù)領(lǐng)域
本申請涉及語音信號處理技術(shù)領(lǐng)域,更具體地說,涉及一種語音轉(zhuǎn)寫方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
目前在企事業(yè)單位、政府部門及教育行業(yè)每年有數(shù)以萬計場的會議,其中重要的會議需要進行記錄并整理成會議紀(jì)要或工作簡報。而在法院審理案件的應(yīng)用中,需要法院的書紀(jì)員記錄審理的過程。語音轉(zhuǎn)寫系統(tǒng)已被越來越多的應(yīng)用于會議紀(jì)要的整理和庭審現(xiàn)場的記錄,通過對音頻的實時或離線轉(zhuǎn)寫,可將語音內(nèi)容轉(zhuǎn)寫成文字,在轉(zhuǎn)寫文字的基礎(chǔ)上進行編輯修改,可以明顯的提高整理會議和記錄庭審內(nèi)容的效率。
現(xiàn)有的語音轉(zhuǎn)寫系統(tǒng)一般采用基于端點檢測段進行語音轉(zhuǎn)寫。所謂端點檢測即檢測出錄音中包含的語音部分。通過端點檢測,在檢測到語音前端點時開始進行轉(zhuǎn)寫,直至檢測到語音后端點時停止轉(zhuǎn)寫,整個轉(zhuǎn)寫文本中不包含任何標(biāo)點符號。顯然,按照現(xiàn)有語音轉(zhuǎn)寫系統(tǒng)輸出的內(nèi)容僅僅是一大串文字的組合,由于不包含任何標(biāo)點停頓,非常不便于編輯人員理解語音真實的表達意思,大大影響編輯效率。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┝艘环N語音轉(zhuǎn)寫方法、裝置、設(shè)備及可讀存儲介質(zhì),用于解決現(xiàn)有語音轉(zhuǎn)寫方法得到的轉(zhuǎn)寫結(jié)果不包含任何標(biāo)點符號,導(dǎo)致編輯人員理解困難、影響編輯效率的問題。
為了實現(xiàn)上述目的,現(xiàn)提出的方案如下:
一種語音轉(zhuǎn)寫方法,包括:
獲取語音數(shù)據(jù);
對所述語音數(shù)據(jù)進行轉(zhuǎn)寫,得到轉(zhuǎn)寫文本;
根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,對所述轉(zhuǎn)寫文本進行編輯操作,得到編輯后轉(zhuǎn)寫文本,編輯后轉(zhuǎn)寫文本包含標(biāo)點。
優(yōu)選地,還包括:
根據(jù)所述編輯后轉(zhuǎn)寫文本包含的標(biāo)點,從所述編輯后轉(zhuǎn)寫文本中確定輸出內(nèi)容。
優(yōu)選地,所述根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,對所述轉(zhuǎn)寫文本進行編輯操作,得到編輯后轉(zhuǎn)寫文本,編輯后轉(zhuǎn)寫文本包含標(biāo)點,包括:
根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,確定所述轉(zhuǎn)寫文本的斷句點及需添加的標(biāo)點;
在所述轉(zhuǎn)寫文本中確定的斷句點處添加對應(yīng)的標(biāo)點,得到編輯后轉(zhuǎn)寫文本。
優(yōu)選地,所述根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,對所述轉(zhuǎn)寫文本進行編輯操作,得到編輯后轉(zhuǎn)寫文本,編輯后轉(zhuǎn)寫文本包含標(biāo)點,還包括:
根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,對所述轉(zhuǎn)寫文本進行文字順滑處理。
優(yōu)選地,所述根據(jù)所述轉(zhuǎn)寫文本的語義信息及停頓信息,確定所述轉(zhuǎn)寫文本的斷句點及需添加的標(biāo)點,以及在所述轉(zhuǎn)寫文本中確定的斷句點處添加對應(yīng)的標(biāo)點,得到編輯后轉(zhuǎn)寫文本,包括:
獲取所述轉(zhuǎn)寫文本中每個編輯單元的向量表達及每個編輯單元的停頓標(biāo)記特征,編輯單元的停頓標(biāo)記特征表征編輯單元后是否有停頓;
將所述轉(zhuǎn)寫文本中每個編輯單元的向量表達及停頓標(biāo)記特征輸入預(yù)置的第一文本編輯模型,得到輸出的編輯后轉(zhuǎn)寫文本;
所述第一文本編輯模型為,預(yù)先以文本訓(xùn)練數(shù)據(jù)包含編輯單元的向量表達及停頓標(biāo)記特征為樣本,以對所述文本訓(xùn)練數(shù)據(jù)中斷句點處添加標(biāo)點后的編輯后文本訓(xùn)練數(shù)據(jù)為樣本標(biāo)簽進行訓(xùn)練得到。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810516113.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 具有中間反應(yīng)層的有限次播放光學(xué)設(shè)備以及制造該設(shè)備的方法
- 用于有限播放光學(xué)設(shè)備的反應(yīng)性物質(zhì)及其制法
- 存儲裝置和信息處理系統(tǒng)
- 用于興趣點識別的系統(tǒng)和方法
- 網(wǎng)絡(luò)配置方法、配置文件集生成方法、裝置及網(wǎng)絡(luò)設(shè)備
- 電子裝置及其操作方法
- 用于將操作系統(tǒng)存儲在計算機可讀介質(zhì)上的BIOS代碼
- 多存儲介質(zhì)并存的配置方法、裝置和系統(tǒng)
- 相機組同步曝光控制方法及系統(tǒng)、計算機可讀存儲介質(zhì)、相機組控制系統(tǒng)
- 炒鍋翻炒方法、計算機可讀存儲介質(zhì)及智能炒菜機





