[發(fā)明專利]一種語(yǔ)音文本的糾錯(cuò)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110206015.3 | 申請(qǐng)日: | 2021-02-24 |
| 公開(kāi)(公告)號(hào): | CN113012705B | 公開(kāi)(公告)日: | 2022-12-09 |
| 發(fā)明(設(shè)計(jì))人: | 劉璐 | 申請(qǐng)(專利權(quán))人: | 海信視像科技股份有限公司 |
| 主分類(lèi)號(hào): | G10L21/007 | 分類(lèi)號(hào): | G10L21/007;G10L15/02;G10L15/08;G10L15/22;G10L15/26;G06F40/253;G06F40/284;G06F40/30 |
| 代理公司: | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 11363 | 代理人: | 郭放;許偉群 |
| 地址: | 266555 山東省青*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 文本 糾錯(cuò) 方法 裝置 | ||
本申請(qǐng)實(shí)施例提供一種語(yǔ)音文本的糾錯(cuò)方法及裝置,方法包括:利用詞語(yǔ)檢錯(cuò)器判斷從語(yǔ)音數(shù)據(jù)中提取的語(yǔ)音文本中是否存在異常單元,如果存在異常單元,從糾錯(cuò)詞基準(zhǔn)庫(kù)中選出與異常單元編輯距離小于編輯距離閾值的候選糾錯(cuò)詞,以及將異常單元替換為候選糾錯(cuò)詞。如果不存在異常單元,則確定所述語(yǔ)音文本正確。本申請(qǐng)?zhí)峁┑恼Z(yǔ)音文本糾錯(cuò)方法和糾錯(cuò)裝置,基于創(chuàng)建的詞語(yǔ)檢錯(cuò)器,能夠避免用戶個(gè)人語(yǔ)音發(fā)音習(xí)慣導(dǎo)致的,語(yǔ)音識(shí)別產(chǎn)品無(wú)法識(shí)別用戶語(yǔ)音的情況,提升用戶使用體驗(yàn)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音文本的糾錯(cuò)方法及裝置。
背景技術(shù)
隨著語(yǔ)音識(shí)別技術(shù)及智能家居的不斷發(fā)展,語(yǔ)音識(shí)別技術(shù)被廣泛應(yīng)用。用戶可通過(guò)語(yǔ)音操控空調(diào),洗衣機(jī)等設(shè)備。語(yǔ)音功能的實(shí)現(xiàn)過(guò)程可以概括為:語(yǔ)音識(shí)別模塊將用戶輸入的音頻轉(zhuǎn)換為文本,之后語(yǔ)義分析模塊對(duì)文本進(jìn)行意圖分類(lèi)以及內(nèi)容理解,最終轉(zhuǎn)換為對(duì)應(yīng)設(shè)備硬件可執(zhí)行的機(jī)器代碼,從而實(shí)現(xiàn)控制設(shè)備的目的。
在語(yǔ)音功能的實(shí)現(xiàn)過(guò)程中,用戶輸入的語(yǔ)音數(shù)據(jù)可能是非標(biāo)準(zhǔn)發(fā)音,這可能會(huì)造成文字識(shí)別錯(cuò)誤,最終導(dǎo)致無(wú)法通過(guò)語(yǔ)音控制設(shè)備的情況發(fā)生。例如,有些用戶平翹舌發(fā)音不準(zhǔn),有些用戶鼻音較重原因等導(dǎo)致輸入非標(biāo)準(zhǔn)發(fā)音。
針對(duì)上述情況,目前的語(yǔ)音識(shí)別引擎雖然在方言和相似發(fā)音方面存在優(yōu)化措施,但是糾錯(cuò)還是嚴(yán)重依賴于用戶數(shù)據(jù)運(yùn)營(yíng)的觀察和用戶投訴。傳統(tǒng)的語(yǔ)音識(shí)別技術(shù)還是不能避免,用戶個(gè)人語(yǔ)音發(fā)音習(xí)慣導(dǎo)致的,語(yǔ)音識(shí)別產(chǎn)品無(wú)法識(shí)別用戶語(yǔ)音的情況,造成用戶使用體驗(yàn)較差。
發(fā)明內(nèi)容
為了解決傳統(tǒng)的故障定位方法耗時(shí)耗力,定位故障根因的效率較低的問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N故障定位方法及裝置。
第一方面,本申請(qǐng)實(shí)施例提供一種語(yǔ)音文本糾錯(cuò)方法,該方法包括:
從用戶輸入的語(yǔ)音數(shù)據(jù)中提取語(yǔ)音文本,利用詞語(yǔ)檢錯(cuò)器檢測(cè)所述語(yǔ)音文本中是否存在異常單元,在所述語(yǔ)音文本中存在異常單元時(shí),從糾錯(cuò)詞基準(zhǔn)庫(kù)中選出與所述異常單元編輯距離小于編輯距離閾值的候選糾錯(cuò)詞,以及將所述異常單元替換為所述候選糾錯(cuò)詞,其中,所述詞語(yǔ)檢錯(cuò)器為基于N-Gram算法創(chuàng)建的;
在所述語(yǔ)音文本中不存在異常單元時(shí),確定所述語(yǔ)音文本正確。第二方面,本申請(qǐng)實(shí)施例提供一種語(yǔ)音文本糾錯(cuò)裝置,該裝置包括:
語(yǔ)音文本提取單元,用于執(zhí)行:從用戶輸入的語(yǔ)音數(shù)據(jù)中提取語(yǔ)音文本;
異常單元判斷單元,用于執(zhí)行:利用詞語(yǔ)檢錯(cuò)器檢測(cè)所述語(yǔ)音文本中是否存在異常單元,其中,所述詞語(yǔ)檢錯(cuò)器為基于N-Gram算法創(chuàng)建的;
候選糾錯(cuò)詞選取單元,用于執(zhí)行:在所述語(yǔ)音文本中存在異常單元時(shí),從糾錯(cuò)詞基準(zhǔn)庫(kù)中選出與所述異常單元編輯距離小于編輯距離閾值的候選糾錯(cuò)詞;
替換單元,用于執(zhí)行:將所述異常單元替換為所述候選糾錯(cuò)詞.
本申請(qǐng)?zhí)峁┑募夹g(shù)方案包括以下有益效果:利用詞語(yǔ)檢錯(cuò)器判斷從語(yǔ)音數(shù)據(jù)中提取的語(yǔ)音文本中是否存在異常單元,如果存在異常單元,從糾錯(cuò)詞基準(zhǔn)庫(kù)中選出與異常單元編輯距離小于編輯距離閾值的候選糾錯(cuò)詞,以及將異常單元替換為候選糾錯(cuò)詞。如果不存在異常單元,則確定所述語(yǔ)音文本正確。本申請(qǐng)?zhí)峁┑恼Z(yǔ)音文本糾錯(cuò)方法和糾錯(cuò)裝置,基于創(chuàng)建的詞語(yǔ)檢錯(cuò)器,能夠避免用戶個(gè)人語(yǔ)音發(fā)音習(xí)慣導(dǎo)致的,語(yǔ)音識(shí)別產(chǎn)品無(wú)法識(shí)別用戶語(yǔ)音的情況,提升用戶使用體驗(yàn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本申請(qǐng)的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示出了本申請(qǐng)實(shí)施例提供的一種語(yǔ)音文本的糾錯(cuò)方法流程示意圖;
圖2示出了本申請(qǐng)實(shí)施例提供的異常單元檢測(cè)示意圖;
圖3示出了本申請(qǐng)實(shí)施例提供的編輯距離比對(duì)示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于海信視像科技股份有限公司,未經(jīng)海信視像科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206015.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





