[發(fā)明專利]一種基于語(yǔ)音處理的科技法庭智能管理方法、系統(tǒng)及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110298078.6 | 申請(qǐng)日: | 2021-03-19 |
| 公開(公告)號(hào): | CN112951238A | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 董曉秀;陳志輝;宋廣亮;李宗峰 | 申請(qǐng)(專利權(quán))人: | 河南蜂云科技發(fā)展有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G10L15/32;G06F40/232 |
| 代理公司: | 鄭州芝麻知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 41173 | 代理人: | 李悅 |
| 地址: | 450000 河南省鄭州市高新技術(shù)產(chǎn)業(yè)開發(fā)*** | 國(guó)省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語(yǔ)音 處理 科技 法庭 智能 管理 方法 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種基于語(yǔ)音處理的科技法庭智能管理方法、系統(tǒng)及存儲(chǔ)介質(zhì),具體步驟有:首先需要設(shè)置將被應(yīng)用到語(yǔ)音識(shí)別的翻譯模塊,其次,根據(jù)輸入語(yǔ)音信息判斷是否存在特定講話者,并據(jù)此從特定講話者用翻譯模塊和未知講話者用翻譯模塊中進(jìn)行翻譯模塊的調(diào)用選擇,再次,根據(jù)輸入語(yǔ)音信息是否被包含在非特定講話者用翻譯模塊中,再次選擇調(diào)用將要被應(yīng)用到語(yǔ)音識(shí)別的翻譯模塊,最后,調(diào)用被選定的要應(yīng)用于語(yǔ)音識(shí)別的翻譯模塊,將輸入語(yǔ)音轉(zhuǎn)換成文本,并對(duì)文本內(nèi)容進(jìn)行錯(cuò)誤檢查和修正。本發(fā)明可以在特定講話者和非特定講話者同時(shí)存在,且不限制講話順序的應(yīng)用場(chǎng)景下,將他們的語(yǔ)音信息區(qū)分開來(lái),并精確地把語(yǔ)音轉(zhuǎn)換成文本,適用于法庭的應(yīng)用場(chǎng)景。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,特別是涉及一種基于語(yǔ)音處理的科技法庭智能管理系統(tǒng)。
背景技術(shù)
當(dāng)前的語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)方式大致可以分為兩類,一類是適用于特定講話者的識(shí)別方式,另一類則是適用于非特定講話者的識(shí)別方式。適用于特定講話者的識(shí)別方式指的是提前獲取要進(jìn)行語(yǔ)音識(shí)別的講話者的語(yǔ)音數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)算法對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,得到特定講話者用翻譯模塊,通過(guò)特定講話者用翻譯模塊可以準(zhǔn)確地將語(yǔ)音轉(zhuǎn)換成文本。適用于非特定講話者的識(shí)別方式指的是將要進(jìn)行語(yǔ)音識(shí)別的語(yǔ)音特征的平均值記錄在非特定講話者用翻譯模塊中,保證通過(guò)非特定講話者用翻譯模塊,任何講話者的語(yǔ)音都可以被成功識(shí)別。
適用于特定講話者的識(shí)別方式較為繁瑣,必須提前對(duì)講話者的語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,否則無(wú)法進(jìn)行語(yǔ)音識(shí)別。而適用于非特定講話者的識(shí)別方式為了保證語(yǔ)音識(shí)別的精確度,會(huì)對(duì)非特定講話者用翻譯模塊中單詞的數(shù)量進(jìn)行限制,因此該方式往往適用于特定的專業(yè)領(lǐng)域中。由于法庭的組成人員復(fù)雜,包括審判員、律師、原告、被告等,且發(fā)言順序并不完全受到限制,多個(gè)講話者的聲音混合在一起,以上兩種語(yǔ)音識(shí)別方式均不能同時(shí)將法庭現(xiàn)場(chǎng)人員的語(yǔ)音信息區(qū)分開來(lái),并精確地識(shí)別為文本。
發(fā)明內(nèi)容
本發(fā)明的主要目的是:提供一種基于語(yǔ)音處理的科技法庭智能管理方法、系統(tǒng)及存儲(chǔ)介質(zhì),同時(shí)將法庭中不同講話者的語(yǔ)音信息轉(zhuǎn)換成文本數(shù)據(jù),并保證語(yǔ)音轉(zhuǎn)換的精確度。
本發(fā)明的目的通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn):
一種基于語(yǔ)音處理的科技法庭智能管理方法,包括如下步驟:
S1、設(shè)置需要被應(yīng)用到語(yǔ)音識(shí)別的翻譯模塊;
S2、根據(jù)輸入語(yǔ)音判斷是否存在特定講話者;
S3、根據(jù)上述S2的判斷結(jié)果,選擇調(diào)用需要被應(yīng)用到語(yǔ)音識(shí)別的翻譯模塊;
S4、根據(jù)輸入語(yǔ)音是否被包含在非特定講話者用翻譯模塊中,再次選擇調(diào)用需要被應(yīng)用到語(yǔ)音識(shí)別的翻譯模塊;
S5、調(diào)用被選定的要應(yīng)用于語(yǔ)音識(shí)別的翻譯模塊,將上述輸入語(yǔ)音轉(zhuǎn)換成文本;
S6、對(duì)經(jīng)語(yǔ)音轉(zhuǎn)換得到的文本進(jìn)行錯(cuò)誤檢測(cè),并對(duì)錯(cuò)誤文本進(jìn)行修正。
進(jìn)一步,所述S1中,需要設(shè)定的將應(yīng)用于語(yǔ)音識(shí)別的翻譯模塊包括:特定講話者用翻譯模塊、在講話者不能確定情況下的未知講話者用翻譯模塊、應(yīng)用在特定專業(yè)領(lǐng)域下的非特定講話者用翻譯模塊、及對(duì)錯(cuò)誤文本進(jìn)行修正要用到的修正用翻譯模塊。
進(jìn)一步,所述S2中,根據(jù)輸入語(yǔ)音信息判斷是否存在特定講話者,具體包括如下步驟:
S21、從輸入語(yǔ)音中提取語(yǔ)音特征信息;
S22、將語(yǔ)音特征信息與特定講話者模型進(jìn)行匹配計(jì)算,得到與不同特定講話者模型的匹配度值;
S23、根據(jù)語(yǔ)音特征信息與不同特定講話者模型的匹配度值確定是否存在特定講話者。
進(jìn)一步,所述S23中,根據(jù)語(yǔ)音特征信息與不同特定講話者模型的匹配度值確定是否存在特定講話者時(shí),選定與所述語(yǔ)音特征最接近的特定講話者。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河南蜂云科技發(fā)展有限公司,未經(jīng)河南蜂云科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110298078.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 基于PageRank和時(shí)間衰減的科技文獻(xiàn)重要度評(píng)價(jià)方法
- 基于手機(jī)APP的科技信息服務(wù)查詢系統(tǒng)
- 一種科技情報(bào)信息管理系統(tǒng)
- 一種高校科技成果收集方法
- 一種表征科技專家成果能力的科技詞條抽取方法
- 一種科技成果轉(zhuǎn)化信息服務(wù)方法及系統(tǒng)
- 一種基于語(yǔ)義分析的科技成果入庫(kù)方法及系統(tǒng)
- 一種科技項(xiàng)目申報(bào)咨詢服務(wù)平臺(tái)
- 面向科技服務(wù)的知識(shí)圖譜構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種科技金融評(píng)估系統(tǒng)的構(gòu)建方法





