[發(fā)明專利]會(huì)議錄音轉(zhuǎn)寫方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110644427.5 | 申請(qǐng)日: | 2021-06-09 |
| 公開(公告)號(hào): | CN113450803A | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 劉晨 | 申請(qǐng)(專利權(quán))人: | 上海明略人工智能(集團(tuán))有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G10L15/08 |
| 代理公司: | 青島清泰聯(lián)信知識(shí)產(chǎn)權(quán)代理有限公司 37256 | 代理人: | 李紅巖 |
| 地址: | 200030 上海市徐匯區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 會(huì)議 錄音 轉(zhuǎn)寫 方法 系統(tǒng) 計(jì)算機(jī) 設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)涉及一種會(huì)議錄音轉(zhuǎn)寫方法、系統(tǒng)、計(jì)算機(jī)和存儲(chǔ)介質(zhì),其中,該方法包括:熱詞語(yǔ)料集合構(gòu)建步驟,獲取待轉(zhuǎn)寫的會(huì)議錄音信息,根據(jù)會(huì)議錄音信息通過網(wǎng)絡(luò)和/或內(nèi)部知識(shí)庫(kù)獲取熱詞擴(kuò)展數(shù)據(jù)并構(gòu)建熱詞語(yǔ)料集合;識(shí)別解碼網(wǎng)絡(luò)構(gòu)建步驟,構(gòu)建識(shí)別解碼網(wǎng)絡(luò);語(yǔ)音信號(hào)解碼步驟,獲取待轉(zhuǎn)寫的會(huì)議錄音,利用所述識(shí)別解碼網(wǎng)絡(luò)解碼所述會(huì)議錄音的每幀語(yǔ)音信號(hào),并在完成最后一幀語(yǔ)音信號(hào)解碼后,選擇最大累計(jì)概率的活躍節(jié)點(diǎn)作為最優(yōu)節(jié)點(diǎn),通過最優(yōu)節(jié)點(diǎn)獲取其對(duì)應(yīng)的單詞序列;熱詞解碼增強(qiáng)步驟,在語(yǔ)音信號(hào)解碼步驟中根據(jù)熱詞語(yǔ)料集合對(duì)所述活躍節(jié)點(diǎn)的歷史路徑進(jìn)行增強(qiáng)。通過本申請(qǐng),實(shí)現(xiàn)對(duì)熱詞識(shí)別的有效增強(qiáng),提高會(huì)議錄音轉(zhuǎn)寫對(duì)熱詞的識(shí)別效果。
技術(shù)領(lǐng)域
本申請(qǐng)涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及會(huì)議錄音轉(zhuǎn)寫方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
越來越多的會(huì)議錄音亟待發(fā)掘其中的價(jià)值,這就需要從錄音轉(zhuǎn)換成文字。語(yǔ)音識(shí)別作為如今普遍的處理上述問題的技術(shù),已經(jīng)廣泛運(yùn)用于手機(jī)助手、智能音箱和智能客服等場(chǎng)景。然而隨著各行各業(yè)大量會(huì)議錄音的產(chǎn)生,通用語(yǔ)音識(shí)別已經(jīng)難以處理各種專業(yè)性較高甚至生澀難懂的詞匯,導(dǎo)致會(huì)議錄音轉(zhuǎn)寫的質(zhì)量往往無法令人滿意。
通用語(yǔ)音識(shí)別技術(shù)預(yù)先基于海量數(shù)據(jù)訓(xùn)練的系統(tǒng)能滿足常用語(yǔ)音輸入撰寫的需要,特別當(dāng)語(yǔ)音輸入內(nèi)容符合原語(yǔ)言模型概率分布時(shí)識(shí)別準(zhǔn)確率往往較高。然而在實(shí)際應(yīng)用中,移動(dòng)互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)快速發(fā)展不斷產(chǎn)生著新的熱點(diǎn)話題及相應(yīng)的熱點(diǎn)詞匯,不同用戶也存在不同個(gè)性化詞匯的識(shí)別需求,如聯(lián)絡(luò)人名等,這些熱點(diǎn)詞匯或個(gè)性化詞匯由于時(shí)效性和特異性在原始采集的語(yǔ)料中往往出現(xiàn)頻度較低,因而原語(yǔ)言模型對(duì)該類詞匯往往覆蓋不足,進(jìn)而導(dǎo)致相應(yīng)識(shí)別系統(tǒng)不能準(zhǔn)確識(shí)別該類熱詞。
會(huì)議錄音轉(zhuǎn)寫的質(zhì)量依賴于關(guān)鍵詞和關(guān)鍵語(yǔ)句的正確識(shí)別,而這些專業(yè)的,需要重點(diǎn)關(guān)注的詞匯一般稱之為熱詞,即熱門詞匯。熱詞既包括上述的專業(yè)領(lǐng)域詞匯,也包括最近比較熱門的新穎詞匯,對(duì)于熱詞的識(shí)別一直是語(yǔ)音識(shí)別領(lǐng)域的一大難題,也是使會(huì)議錄音轉(zhuǎn)寫更好滿足用戶需求的一大契合點(diǎn)。
現(xiàn)有語(yǔ)音識(shí)別技術(shù)一般缺乏對(duì)于專業(yè)熱詞和實(shí)時(shí)熱詞的支持,考慮到專業(yè)熱詞的搜集和整理有比較高的門檻,無法比較全面正確的獲??;實(shí)時(shí)熱詞由于對(duì)時(shí)效性以及整合進(jìn)系統(tǒng)的速度要求較高,也存在無法及時(shí)更新的困難。為了保證會(huì)議錄音轉(zhuǎn)寫的用戶體驗(yàn),必須有一個(gè)比較好的方案去解決如何提高熱詞識(shí)別的難題。
為此,目前會(huì)議錄音轉(zhuǎn)寫或者語(yǔ)音識(shí)別過程中對(duì)于熱詞識(shí)別主要通過加強(qiáng)語(yǔ)言模型,采用系統(tǒng)參數(shù)重估的方法,在將新收集的熱詞語(yǔ)料加入原語(yǔ)料庫(kù)后,重新訓(xùn)練新的語(yǔ)言模型以提高對(duì)新增熱詞的識(shí)別準(zhǔn)確率。然而,在實(shí)際應(yīng)用中,熱詞更新頻度往往較高,而所需熱詞考慮其專業(yè)性和復(fù)雜性,獲取足質(zhì)足量的語(yǔ)料有相當(dāng)大的難度,現(xiàn)有技術(shù)無法及時(shí)收集足夠語(yǔ)料參與系統(tǒng)參數(shù)重估,進(jìn)而影響對(duì)熱詞的識(shí)別效果。另一方面,語(yǔ)言模型的重新訓(xùn)練以及識(shí)別系統(tǒng)資源,如基于WFST(Weighted Finite-State Transducers,加權(quán)有限狀態(tài)轉(zhuǎn)換器)的解碼識(shí)別網(wǎng)絡(luò),的構(gòu)建往往費(fèi)時(shí)較多,代價(jià)較大,無法實(shí)現(xiàn)對(duì)熱詞識(shí)別的快速響應(yīng)。
目前針對(duì)上述熱詞識(shí)別及時(shí)更新困難、無法實(shí)現(xiàn)對(duì)熱詞識(shí)別的快速響應(yīng)的問題,尚未提出有效的解決方案。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種會(huì)議錄音轉(zhuǎn)寫方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),保證在原語(yǔ)言模型不做變動(dòng)的情況下實(shí)現(xiàn)對(duì)熱詞的精確識(shí)別,解決現(xiàn)有技術(shù)無法快速、準(zhǔn)確識(shí)別會(huì)議特定領(lǐng)域的專業(yè)詞匯和實(shí)時(shí)熱點(diǎn)詞匯以及用戶個(gè)性化詞匯的技術(shù)問題。
第一方面,本申請(qǐng)實(shí)施例提供了一種會(huì)議錄音轉(zhuǎn)寫方法,包括:
熱詞語(yǔ)料集合構(gòu)建步驟,獲取用戶提交的待轉(zhuǎn)寫的會(huì)議錄音信息,根據(jù)所述會(huì)議錄音信息通過網(wǎng)絡(luò)和/或內(nèi)部知識(shí)庫(kù)獲取熱詞擴(kuò)展數(shù)據(jù)并構(gòu)建熱詞語(yǔ)料集合;
識(shí)別解碼網(wǎng)絡(luò)構(gòu)建步驟,構(gòu)建識(shí)別解碼網(wǎng)絡(luò);具體的,所述識(shí)別解碼網(wǎng)絡(luò)為基于WFST的識(shí)別解碼網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海明略人工智能(集團(tuán))有限公司,未經(jīng)上海明略人工智能(集團(tuán))有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110644427.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種實(shí)現(xiàn)視頻會(huì)議資源調(diào)度的方法
- 一種會(huì)議系統(tǒng)的實(shí)現(xiàn)方法
- 視頻會(huì)議跨級(jí)控制方法及系統(tǒng)
- 一種用應(yīng)用服務(wù)器實(shí)現(xiàn)子會(huì)議功能的方法和系統(tǒng)
- 一種通過互動(dòng)式語(yǔ)音應(yīng)答接入會(huì)議的方法及系統(tǒng)
- 基于SIP協(xié)議的分布式會(huì)議方法
- 會(huì)議控制方法和裝置
- 待召開會(huì)議的會(huì)議議程生成方法以及裝置
- 會(huì)議控制方法和裝置
- 會(huì)議流程的管理方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 一種智能會(huì)議系統(tǒng)
- 圖像處理設(shè)備及其轉(zhuǎn)寫控制方法
- 一種音頻處理方法、裝置及存儲(chǔ)介質(zhì)
- 一種文本轉(zhuǎn)寫方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 按服務(wù)時(shí)長(zhǎng)提供語(yǔ)音轉(zhuǎn)寫服務(wù)的方法及系統(tǒng)
- 會(huì)議語(yǔ)音轉(zhuǎn)寫方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音轉(zhuǎn)寫方法、裝置、錄音筆和存儲(chǔ)介質(zhì)
- 語(yǔ)音轉(zhuǎn)寫方法、裝置、錄音筆和存儲(chǔ)介質(zhì)
- 轉(zhuǎn)寫方法、裝置、錄音筆和存儲(chǔ)介質(zhì)
- 轉(zhuǎn)寫機(jī)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





