[發(fā)明專利]語音識別方法和裝置有效
| 申請?zhí)枺?/td> | 201610795918.9 | 申請日: | 2016-08-31 |
| 公開(公告)號: | CN106328147B | 公開(公告)日: | 2022-02-01 |
| 發(fā)明(設(shè)計)人: | 高建清;陳恩紅;王智國;胡國平;胡郁;劉慶峰 | 申請(專利權(quán))人: | 中國科學(xué)技術(shù)大學(xué);科大訊飛股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/197;G10L15/18 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 裝置 | ||
本發(fā)明公開一種語音識別方法和裝置。所述方法包括:獲取與待識別語音數(shù)據(jù)相關(guān)的基礎(chǔ)資料;確定所述基礎(chǔ)資料的關(guān)鍵詞;依據(jù)所述關(guān)鍵詞確定搜索項,通過所述搜索項搜索目標語料;通過所述目標語料訓(xùn)練目標主題語言模型,以所述目標主題語言模型識別所述待識別語音數(shù)據(jù)。應(yīng)用本發(fā)明提供的技術(shù)方案,能夠提高識別特定應(yīng)用場景的語音數(shù)據(jù)的準確度,識別效果較好。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種語音識別方法和裝置。
背景技術(shù)
語音識別是將語音轉(zhuǎn)成文本的過程,近年來,隨著語音識別技術(shù)的成熟,該技術(shù)已逐漸成功應(yīng)用于各行各業(yè)中,尤其是針對特定領(lǐng)域的語音識別技術(shù),如針對會議的錄音數(shù)據(jù)進行語音識別,將接收的語音數(shù)據(jù)直接轉(zhuǎn)換為會議的文本內(nèi)容,大大方便了會議秘書整理會議紀要。
目前的技術(shù)中,一般直接采用通用的聲學(xué)模型及通用語言模型對待識別語音數(shù)據(jù)進行語音識別,針對特定應(yīng)用場景的語音數(shù)據(jù)進行語音識別時,由于經(jīng)常會存在專業(yè)詞匯、特定用法導(dǎo)致無法正確識別的問題,僅僅依靠通用語言模型往往無法滿足應(yīng)用需求,因此往往采用語言模型定制的方式,即預(yù)先獲取用戶提供的大量與該特定應(yīng)用場景相關(guān)的語料后,訓(xùn)練相應(yīng)的主題語言模型,利用該主題語言模型、通用的聲學(xué)模型及通用語言模型進行語音識別。
然而,在實際應(yīng)用中,往往僅知道少量應(yīng)用場景信息,無法通過用戶直接獲取到足夠數(shù)量的主題相關(guān)的語料以訓(xùn)練主題相關(guān)語言模型,導(dǎo)致語音識別的準確度比較低,識別效果較差,如待識別語音數(shù)據(jù)為會議錄音時,往往僅知道會議相關(guān)的演示文稿,數(shù)據(jù)量較少,不足以訓(xùn)練相應(yīng)的主題語言模型,導(dǎo)致語音識別效果較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種語音識別方法和裝置,能夠提高識別特定應(yīng)用場景的語音數(shù)據(jù)的準確度,識別效果較好。
為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
第一方面,本發(fā)明實施例提供了一種語音識別方法,包括:
獲取與待識別語音數(shù)據(jù)相關(guān)的基礎(chǔ)資料;
確定所述基礎(chǔ)資料的關(guān)鍵詞;
依據(jù)所述關(guān)鍵詞確定搜索項,通過所述搜索項搜索目標語料;
通過所述目標語料訓(xùn)練目標主題語言模型,以所述目標主題語言模型識別所述待識別語音數(shù)據(jù)。
可選的,所述確定所述基礎(chǔ)資料的關(guān)鍵詞,包括:
以第一確定方式確定所述關(guān)鍵詞,所述第一確定方式包括,依據(jù)預(yù)先訓(xùn)練得到的編碼-解碼模型計算所述基礎(chǔ)資料中每個詞作為所述關(guān)鍵詞的概率,將所述概率大于第一預(yù)設(shè)閾值的詞確定為所述關(guān)鍵詞;
或者以第二確定方式確定所述關(guān)鍵詞,所述第二確定方式包括,計算所述基礎(chǔ)資料中每個詞的詞頻和逆文檔頻率,將所述詞頻大于第二預(yù)設(shè)閾值且所述逆文檔頻率大于第三預(yù)設(shè)閾值的詞確定所述關(guān)鍵詞;
或者以第三確定方式確定所述關(guān)鍵詞,所述第三確定方式包括,計算所述基礎(chǔ)資料中每個詞的TextRank得分,將所述TextRank得分大于第四預(yù)設(shè)閾值的詞作為所述關(guān)鍵詞;
或者所述第一確定方式、所述第二確定方式和所述第三確定方式中,以任意兩種方式或三種方式相結(jié)合來確定候選關(guān)鍵詞,將經(jīng)過去重后的所述候選關(guān)鍵詞作為所述關(guān)鍵詞。
可選的,所述依據(jù)所述關(guān)鍵詞確定搜索項,通過所述搜索項搜索目標語料,包括:
統(tǒng)計所述基礎(chǔ)資料的每個句子中包含的所述關(guān)鍵詞個數(shù),將包含至少兩個關(guān)鍵詞的句子中的所有關(guān)鍵詞作為一個關(guān)鍵詞組,將不屬于任一所述關(guān)鍵詞組的所述關(guān)鍵詞作為獨立關(guān)鍵詞;
依據(jù)所述關(guān)鍵詞組和所述獨立關(guān)鍵詞確定所述搜索項,通過所述搜索項搜索所述目標語料。
可選的,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)技術(shù)大學(xué);科大訊飛股份有限公司,未經(jīng)中國科學(xué)技術(shù)大學(xué);科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610795918.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





