[發(fā)明專利]一種基于移動終端的角色分離會議速記系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202010935316.5 | 申請日: | 2020-09-08 |
| 公開(公告)號: | CN112053679A | 公開(公告)日: | 2020-12-08 |
| 發(fā)明(設(shè)計)人: | 虞焰興 | 申請(專利權(quán))人: | 安徽聲訊信息技術(shù)有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/26;G10L15/30;G10L17/02;G10L17/04;G10L17/08;G10L25/24;G10L25/27;G10L25/69 |
| 代理公司: | 合肥律眾知識產(chǎn)權(quán)代理有限公司 34147 | 代理人: | 秦超 |
| 地址: | 230000 安徽省合肥市高新區(qū)習(xí)友路33*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 移動 終端 角色 分離 會議 速記 系統(tǒng) 方法 | ||
本發(fā)明公開了一種基于移動終端的角色分離會議速記系統(tǒng)及方法,利用移動終端自帶ID的屬性進行語音采集,該ID會一直跟隨該移動終端采集音頻的后續(xù)處理,實現(xiàn)音頻自標(biāo)簽,進而實現(xiàn)會議記錄文本中的角色自分離。
技術(shù)領(lǐng)域
本發(fā)明涉及會議記錄技術(shù)領(lǐng)域,具體是一種基于移動終端的角色分離會議速記系統(tǒng)及方法。
背景技術(shù)
將會議語音實時存儲并轉(zhuǎn)換成會議記錄文本,在逐步取代人工會議速記。然而,傳統(tǒng)會議速記系統(tǒng)僅用于收集語音并轉(zhuǎn)換成文本,無法對不同發(fā)言人的語音進行區(qū)分,形成角色分離的會議記錄文本。
國家知識產(chǎn)權(quán)局于2019年6月7日授權(quán)公告的發(fā)明專利CN108564952B公開了一種語音角色分離方法,通過多陣列指向性麥克風(fēng)對不同人的聲音進行采集,利用算法與硬件相結(jié)合,提高語音角色分離的準(zhǔn)確率,并增強每個聲道音頻對應(yīng)所指向的說話角色的音頻,對其他側(cè)面音頻進行降噪、消回音處理,然后切分并按照音頻對應(yīng)的說話角色進行區(qū)分標(biāo)注。此方法雖然在一定程度上實現(xiàn)了語音角色分離,但是需要配置多陣列指向性麥克風(fēng)以及各種音頻處理模塊,并且側(cè)面音頻的切分和標(biāo)注給后期處理帶來了較大的工作量,不便于直接生成會議記錄文本。
國家知識產(chǎn)權(quán)局于2020年5月5日公布的發(fā)明專利申請CN111105801A公開了一種角色語音分離方法,基于聲紋識別實現(xiàn)語音片段進行收集和整理,但是誠如發(fā)明專利CN108564952B背景技術(shù)中提及的,聲紋識別在理想錄音環(huán)境下的分離效果較好,在較為復(fù)雜的會議場景下,角色分離的準(zhǔn)確率會大打折扣,并且需要后期聚類處理,不便于直接生成會議記錄文本。
目前的語音角色分離主要是基于軟硬件集合的獨立語音分離設(shè)備,在分離處理上也存在滯后性,與實時性要求很高的會議速記系統(tǒng)無法很好地融合,形成能夠?qū)崿F(xiàn)角色分離的會議記錄系統(tǒng)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的技術(shù)缺陷,本發(fā)明提供一種基于移動終端的角色分離會議速記系統(tǒng)及方法,通過每個移動終端的特有ID,實現(xiàn)語音的角色自分離,直接形成角色分離的會議記錄文本。
本發(fā)明公開了一種基于移動終端的角色分離會議速記系統(tǒng),包括位于每位參會發(fā)言者面前的移動終端、與所述移動終端無線連接的會議速記服務(wù)器、與所述會議速記服務(wù)器網(wǎng)絡(luò)連接的ASR服務(wù)器、與所述ASR服務(wù)器網(wǎng)絡(luò)連接的NLP服務(wù)器;
所述移動終端用于采集對應(yīng)發(fā)言者的音頻并連同自身ID發(fā)送至所述會議速記服務(wù)器,所述會議速記服務(wù)器將音頻轉(zhuǎn)發(fā)至所述ASR服務(wù)器;
所述ASR服務(wù)器用于將音頻內(nèi)容轉(zhuǎn)換成一次文本發(fā)送至所述NLP服務(wù)器,所述NLP服務(wù)器用于將一次文本按照自然語言進行自動修正,并將修正后的二次文本經(jīng)所述ASR服務(wù)器返回至所述會議速記服務(wù)器,所述會議速記服務(wù)器將二次文本按照對應(yīng)ID進行匹配,即時形成角色分離的會議記錄文本。
進一步的,所述移動終端基于微信公眾平臺或APP進行語音采集,并按照自然句對采集到的音頻流進行切割,并將切割后的音頻段連同自身ID按序發(fā)送至所述ASR服務(wù)器。
進一步的,所述會議速記服務(wù)器網(wǎng)絡(luò)連接有人工編輯終端,所述會議速記服務(wù)器記錄每一音頻段的跟隨ID、開始時間和結(jié)束時間,及其對應(yīng)的音頻代碼和文本,生成日志文件,并根據(jù)該日志文件將每一音頻段與其二次文本以及移動終端ID進行一一對應(yīng);所述人工編輯終端用于根據(jù)一一對應(yīng)的音頻段和二次文本進行會議記錄的人工修正。
進一步的,會議現(xiàn)場設(shè)置有與所述會議速記服務(wù)器網(wǎng)絡(luò)連接的同步顯示終端,用于對會議記錄進行實時顯示。
本發(fā)明還保護一種基于移動終端的角色分離會議速記方法,利用移動終端自帶ID的屬性進行語音采集,實現(xiàn)會議記錄文本中的角色自分離;更具體的,至少包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽聲訊信息技術(shù)有限公司,未經(jīng)安徽聲訊信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010935316.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 角色控制裝置、角色控制方法、記錄介質(zhì)及程序
- 網(wǎng)絡(luò)游戲系統(tǒng)中的角色數(shù)據(jù)管理裝置和方法
- 網(wǎng)絡(luò)游戲系統(tǒng)中的角色數(shù)據(jù)管理裝置和方法
- 游戲系統(tǒng)
- 角色頒發(fā)方法、訪問控制方法及相關(guān)設(shè)備
- 角色令牌頒發(fā)方法、訪問控制方法及相關(guān)設(shè)備
- 監(jiān)察審批操作、授權(quán)操作及表單操作的方法
- 監(jiān)察審批操作、授權(quán)操作及表單操作的方法
- 虛擬角色控制方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種游戲角色的生成方法、裝置及其設(shè)備





