[發(fā)明專利]語(yǔ)音交互中的易錯(cuò)字校準(zhǔn)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201610248440.8 | 申請(qǐng)日: | 2016-04-20 |
| 公開(kāi)(公告)號(hào): | CN107305768B | 公開(kāi)(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 黃亦睿;劉功申;蘇波;劉春梅;李建華 | 申請(qǐng)(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/18 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 郭國(guó)中 |
| 地址: | 200240 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 交互 中的 錯(cuò)字 校準(zhǔn) 方法 | ||
本發(fā)明提供了一種語(yǔ)音交互中的易錯(cuò)字校準(zhǔn)方法,包括:識(shí)別語(yǔ)境步驟、基于限制語(yǔ)義的自動(dòng)糾錯(cuò)步驟、基于語(yǔ)義反饋的人工糾錯(cuò)步驟。本發(fā)明通過(guò)與用戶語(yǔ)音交互,感知、識(shí)別話題語(yǔ)境,從而在受限語(yǔ)義范圍內(nèi),利用命名實(shí)體識(shí)別技術(shù),對(duì)含有特定意義的實(shí)體實(shí)現(xiàn)自動(dòng)糾錯(cuò)功能,并支持通過(guò)人工反饋獲得附加語(yǔ)義進(jìn)而糾錯(cuò),實(shí)現(xiàn)比現(xiàn)有語(yǔ)音識(shí)別軟件更高的輸入效率以及更方便的錯(cuò)字修正方式。
技術(shù)領(lǐng)域
本發(fā)明涉及易錯(cuò)字校準(zhǔn)技術(shù),具體地,涉及語(yǔ)音交互中的易錯(cuò)字校準(zhǔn)方法,尤其是將自然語(yǔ)言理解方法應(yīng)用于語(yǔ)音交互易錯(cuò)字的校準(zhǔn)與糾正中,實(shí)現(xiàn)了一個(gè)可用的語(yǔ)音交互易錯(cuò)字校準(zhǔn)方案。
背景技術(shù)
語(yǔ)音交互作為一種人機(jī)交互的新途徑,近年來(lái),獲得了突飛猛進(jìn)的廣泛應(yīng)用。這首先源于語(yǔ)音識(shí)別技術(shù)的發(fā)展,從隱馬爾科夫模型(Hidden Markov Model,HMM)、混合高斯模型(Gaussian Mixture Model,GMM)到現(xiàn)在的深度神經(jīng)網(wǎng)絡(luò)模型(Deep Neural Network,DNN),語(yǔ)音識(shí)別系統(tǒng)的錯(cuò)誤率大幅下降;其次,智能設(shè)備用戶的使用習(xí)慣尚未成型,新技術(shù)如語(yǔ)音交互容易被大眾接受;而云計(jì)算、移動(dòng)互聯(lián)網(wǎng)的超常規(guī)發(fā)展使得大量的全新語(yǔ)料資源產(chǎn)生進(jìn)而助推了語(yǔ)音識(shí)別技術(shù)的發(fā)展。
在很多場(chǎng)景下,語(yǔ)音交互具有更加現(xiàn)實(shí)的實(shí)用價(jià)值,符合人類的交互習(xí)慣。然而,由于語(yǔ)音輸入不可避免會(huì)受到環(huán)境噪聲、衰落信道的影響,經(jīng)常會(huì)產(chǎn)生很多錯(cuò)誤結(jié)果,此外,由于漢語(yǔ)中存在大量的同音字、音近字現(xiàn)象,導(dǎo)致機(jī)器無(wú)法準(zhǔn)確識(shí)別用戶的語(yǔ)音輸入,使語(yǔ)音識(shí)別中較易出現(xiàn)錯(cuò)字。換言之,目前的語(yǔ)音識(shí)別正確率尚未達(dá)到人們期望的水平,語(yǔ)音識(shí)別技術(shù)也必須在很多方面取得突破性進(jìn)展。
經(jīng)對(duì)現(xiàn)有技術(shù)文獻(xiàn)的檢索發(fā)現(xiàn),中國(guó)專利文獻(xiàn)號(hào)CN201210584746.2,公開(kāi)號(hào)CN103021412A,記載了一種“語(yǔ)音識(shí)別方法和系統(tǒng)”,該技術(shù)包括:對(duì)用戶輸入的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別,獲得語(yǔ)音識(shí)別結(jié)果以及語(yǔ)音識(shí)別結(jié)果中各字符對(duì)應(yīng)的語(yǔ)音片段;接收用戶單獨(dú)輸入的糾錯(cuò)信息并生成糾錯(cuò)字符串;根據(jù)糾錯(cuò)字符串確定用戶輸入的語(yǔ)音信號(hào)中產(chǎn)生識(shí)別錯(cuò)誤的語(yǔ)音段;根據(jù)語(yǔ)音識(shí)別結(jié)果中各字符對(duì)應(yīng)的語(yǔ)音片段,確定產(chǎn)生識(shí)別錯(cuò)誤的語(yǔ)音段在語(yǔ)音識(shí)別結(jié)果中所對(duì)應(yīng)的字符串,作為錯(cuò)誤字符串;利用糾錯(cuò)字符串替換錯(cuò)誤字符串。該技術(shù)實(shí)現(xiàn)一種錯(cuò)誤字符串糾錯(cuò)方法,但糾錯(cuò)字符串的錄入需要使用特殊按鍵后方可錄入,或使用拼音、手寫等其他方式錄入。其中語(yǔ)音錄入方式僅可重復(fù)之前錄入內(nèi)容,以期達(dá)到修正錯(cuò)誤識(shí)別的目的;但若用戶錄入的字詞未被系統(tǒng)所錄入,則該方案將無(wú)法正確糾正。
中國(guó)專利文獻(xiàn)號(hào)CN201310589827.6,公開(kāi)號(hào)CN103680505A,記載了一種“語(yǔ)音識(shí)別方法及系統(tǒng)”,該方法包括:持續(xù)接收錄音輸入;利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞;如果所述錄音中包含所述關(guān)鍵詞,則利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述關(guān)鍵詞后的錄音進(jìn)行識(shí)別,得到識(shí)別結(jié)果。該技術(shù)解決了長(zhǎng)時(shí)間監(jiān)聽(tīng)命令時(shí)的識(shí)別準(zhǔn)確率問(wèn)題,可由小詞匯量網(wǎng)絡(luò)順利過(guò)渡至正常的語(yǔ)音識(shí)別階段,即文中所述的大詞匯量網(wǎng)絡(luò)。但該技術(shù)并未對(duì)大詞匯量網(wǎng)絡(luò)進(jìn)行優(yōu)化,如限制語(yǔ)境下的語(yǔ)義增強(qiáng)等,且未提到相關(guān)的易錯(cuò)字校準(zhǔn)技術(shù)。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種語(yǔ)音交互中的易錯(cuò)字校準(zhǔn)方法。本發(fā)明使用現(xiàn)有語(yǔ)音識(shí)別API(Application Programming Interface,應(yīng)用程序編程接口),完成一個(gè)可用的有價(jià)值的易錯(cuò)字校準(zhǔn)系統(tǒng)。該系統(tǒng)通過(guò)與用戶語(yǔ)音交互,感知、識(shí)別話題語(yǔ)境,從而在受限語(yǔ)義范圍內(nèi),利用命名實(shí)體識(shí)別技術(shù),對(duì)含有特定意義的實(shí)體實(shí)現(xiàn)自動(dòng)糾錯(cuò)功能,并支持通過(guò)人工反饋獲得附加語(yǔ)義進(jìn)而糾錯(cuò),實(shí)現(xiàn)比現(xiàn)有語(yǔ)音識(shí)別軟件更高的輸入效率以及更方便的錯(cuò)字修正方式。
根據(jù)本發(fā)明提供的一種語(yǔ)音交互中的易錯(cuò)字校準(zhǔn)方法,包括:
識(shí)別語(yǔ)境步驟:針對(duì)不同的領(lǐng)域創(chuàng)建相應(yīng)的語(yǔ)境知識(shí)庫(kù),構(gòu)造語(yǔ)境知識(shí)庫(kù)的步驟包括:首先根據(jù)領(lǐng)域的關(guān)鍵詞,通過(guò)搜索引擎得到相關(guān)文檔,作為該領(lǐng)域的語(yǔ)料庫(kù);然后根據(jù)語(yǔ)義知識(shí),獲取該領(lǐng)域的核心詞,按照核心詞聚類得到該領(lǐng)域的實(shí)例句子,從而構(gòu)建了語(yǔ)境知識(shí)庫(kù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610248440.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





