[發(fā)明專利]基于語音識別的會議記錄生成方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910627403.1 | 申請日: | 2019-07-11 |
| 公開(公告)號: | CN110335612A | 公開(公告)日: | 2019-10-15 |
| 發(fā)明(設(shè)計)人: | 林子童;邵嘉琦;劉屹;肖金平;郭翼斌;萬正勇;沈志勇 | 申請(專利權(quán))人: | 招商局金融科技有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/22;G10L15/04;G10L15/08;G10L15/22;G10L15/26;G06F16/63 |
| 代理公司: | 深圳市沃德知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)華富街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 會議記錄 句子 語音段 轉(zhuǎn)換 身份信息 聲紋特征 語音識別 計算機(jī)存儲介質(zhì) 聲紋特征庫 比對分析 存儲介質(zhì) 電子裝置 接收用戶 目標(biāo)語音 生成指令 預(yù)設(shè) 調(diào)用 集合 文本 | ||
本發(fā)明揭露了一種基于語音識別的會議記錄生成方法,該方法包括:接收用戶發(fā)出的會議記錄生成指令,獲取待轉(zhuǎn)換音頻;對所述待轉(zhuǎn)換音頻進(jìn)行句子劃分,得到所述待轉(zhuǎn)換音頻的音頻句子;分別從識別出的所述音頻句子中提取聲紋特征,將各音頻句子對應(yīng)的聲紋特征與預(yù)設(shè)聲紋特征庫進(jìn)行比對分析,確定各音頻句子對應(yīng)的說話人身份信息,并根據(jù)所述說話人身份信息將所述音頻句子劃分為語音段,確定所述待轉(zhuǎn)換音頻對應(yīng)的語音段集合;調(diào)用各語音段對應(yīng)的目標(biāo)語音識別模型,依次得到各語音段對應(yīng)的文本;及,生成所述待轉(zhuǎn)換音頻對應(yīng)的會議記錄。本發(fā)明還揭露了一種電子裝置及計算機(jī)存儲介質(zhì)。利用本發(fā)明,可提高會議記錄生成的準(zhǔn)確性及效率。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于語音識別的會議記錄生成方法、電子裝置及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
目前,會議記錄的撰寫方式主要為:首先,會議現(xiàn)場記錄關(guān)鍵詞;其次,會議后在會議錄音中尋找關(guān)鍵詞并重聽關(guān)鍵詞附近錄音并擴(kuò)展關(guān)鍵詞以形成會議記錄。但是由于關(guān)鍵詞和錄音之間沒有對應(yīng)關(guān)系,記錄人員在會后翻找關(guān)鍵詞時需要通過人工反復(fù)定位尋找,耗費(fèi)時間,操作也比較麻煩,更進(jìn)一步,如果會議中同一個關(guān)鍵詞出現(xiàn)多次,僅靠人工重聽錄音定位可能出現(xiàn)錯誤定位的情況,導(dǎo)致會議記錄出現(xiàn)記錄錯誤。
為了解決上述問題,目前市面上出現(xiàn)了依托于語音轉(zhuǎn)換技術(shù)自動生成會議記錄文本的會議記錄產(chǎn)品,然而,這種現(xiàn)有的會議記錄產(chǎn)品通常為簡單的語音轉(zhuǎn)文字產(chǎn)品,語音轉(zhuǎn)換的準(zhǔn)確率得不到保障,記錄人員在使用后得到的是一篇長文本,它與會議錄音并無掛鉤,加上語音轉(zhuǎn)文字技術(shù)不夠成熟,往往記錄人員在拿到文本后因轉(zhuǎn)文錯誤較多無從下手,最后還是只能依靠人工聽錄音的方式去完成會議記錄。
因此,如何便捷、準(zhǔn)確地生成會議記錄成為一個亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
鑒于以上內(nèi)容,本發(fā)明提供一種基于語音識別的會議記錄生成方法、電子裝置及計算機(jī)可讀存儲介質(zhì),其主要目的在于提高會議記錄生成的效率及準(zhǔn)確性。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于語音識別的會議記錄生成方法,該方法包括:
接收步驟:接收用戶發(fā)出的會議記錄生成指令,根據(jù)所述會議記錄生成指令獲取待轉(zhuǎn)換音頻,或者,定時或?qū)崟r從預(yù)設(shè)存儲路徑中獲取待轉(zhuǎn)換音頻;
第一劃分步驟:對所述待轉(zhuǎn)換音頻進(jìn)行句子劃分,得到所述待轉(zhuǎn)換音頻的音頻句子;
第二劃分步驟:分別從所述音頻句子中提取聲紋特征,將各個所述音頻句子的聲紋特征與預(yù)設(shè)聲紋特征庫進(jìn)行對比分析,確定各個所述音頻句子對應(yīng)的說話人身份信息,并根據(jù)所述說話人身份信息將所述音頻句子劃分為語音段,確定所述待轉(zhuǎn)換音頻對應(yīng)的語音段集合;
語音識別步驟:根據(jù)所述語音段集合中各語音段對應(yīng)的說話人身份信息調(diào)用各語音段對應(yīng)的目標(biāo)語音識別模型,依次將各語音段輸入對應(yīng)的目標(biāo)語音識別模型,得到各語音段對應(yīng)的文本片段,其中,所述目標(biāo)語音識別模型是基于口音語料庫及行業(yè)語料庫進(jìn)行更新訓(xùn)練得到的;及
生成步驟:合并各語音段對應(yīng)的文本片段,生成所述待轉(zhuǎn)換音頻對應(yīng)的目標(biāo)文本,并在所述目標(biāo)文本的每個所述文本片段中關(guān)聯(lián)對應(yīng)的語音段及說話人身份信息,生成所述待轉(zhuǎn)換音頻對應(yīng)的會議記錄。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種電子裝置,該裝置包括:存儲器、處理器,所述存儲器中存儲有可在所述處理器上運(yùn)行的會議記錄生成程序,所述會議記錄生成程序被所述處理器執(zhí)行時可實(shí)現(xiàn)如上所述基于語音識別的會議記錄生成方法中的任意步驟。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)中包括會議記錄生成程序,所述會議記錄生成程序被處理器執(zhí)行時,可實(shí)現(xiàn)如上所述基于語音識別的會議記錄生成方法中的任意步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于招商局金融科技有限公司,未經(jīng)招商局金融科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910627403.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





