[發明專利]語音識別錯誤的糾正方法及裝置有效
| 申請號: | 201310604269.6 | 申請日: | 2013-11-25 |
| 公開(公告)號: | CN103871407A | 公開(公告)日: | 2014-06-18 |
| 發明(設計)人: | 李根培;崔俊輝;李仁載;李東賢;徐弘錫;金龍熙;柳成瀚;具常俊 | 申請(專利權)人: | 浦項工科大學校產學協力團 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 崔征 |
| 地址: | 韓國慶尚北*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 錯誤 糾正 方法 裝置 | ||
本申請主張申請日為2012年12月7日的韓國專利申請No.10-2012-0141972的優先權,該在先申請的全文引入本說明書作為參考。
技術領域
本發明涉及語音識別錯誤的糾正方法及裝置,更詳細地涉及一種用于糾正在語音識別裝置中產生的錯誤的語音識別錯誤糾正方法及裝置。
背景技術
由于智能手機、平板電腦等移動設備的普及,提高了對語音識別應用軟件(例如,如蘋果公司的SIRI一樣的對話系統)的關注。但是現在語音識別技術的準確度不高,由此頻繁產生語音識別的錯誤,這導致了語音識別應用軟件中出現故障。
發明內容
用于解決上述問題的本發明的目的在于,提供一種語音識別錯誤糾正方法,其用于以平行語料庫為基礎對語音識別的錯誤進行糾正。
用于解決上述問題的本發明的另一個目的在于,提供一種語音識別錯誤糾正裝置,其用于以平行語料庫為基礎對語音識別的錯誤進行糾正。
在一些實施例中,語音識別錯誤糾正裝置執行的語音識別錯誤糾正方法包括如下步驟:以通過正確答案語料庫以及領域語料庫學習的語言模型為基礎,對語音識別結果的錯誤可能性進行判斷;在上述錯誤可能性大于事先定義的基準的情況下,根據語音識別結果是否與正確答案語料庫相匹配生成平行語料庫;根據平行語料庫生成語音識別模型;以及根據語音識別模型和語言模型,對錯誤的語音識別結果進行糾正。
在此,在判斷錯誤可能性的步驟中,可根據上述語音識別結果的生成概率對語音識別結果的錯誤可能性進行判斷。
在此,上述生成平行語料庫的步驟可包括如下步驟:從上述正確答案語料庫以及上述語音識別結果中對正確答案集進行檢測;從上述正確答案語料庫以及上述語音識別結果中對錯誤答案集進行檢測;以及以上述正確答案語料庫、上述語音識別結果、上述正確答案集及上述錯誤答案集為基礎,生成上述平行語料庫。
在此,上述生成語音識別模型步驟可包括如下步驟:從上述平行語料庫中對語音識別前的第一語法進行檢測;從上述平行語料庫中對語音識別后的第二語法進行檢測;對上述第一語法和上述第二語法之間的語音識別概率進行計算;以及以上述第一語法、上述第二語法以及上述語音識別概率為基礎,生成上述語音識別模型。
在此,上述對語音識別結果的錯誤進行糾正的步驟可包括如下步驟:根據上述第一語法和上述第二語法之間的對應關系生成圖表;從上述圖表中對具有最小錯誤的路徑進行檢測;以及以檢測的路徑為基礎,對上述錯誤的語音識別結果進行糾正。
在此,上述生成圖表的步驟中,在不存在對應于第二語法的第一語法的情況下,可將第二語法假設為第一語法。
在此,在以上述檢測的路徑為基礎對錯誤的語音識別結果進行糾正的步驟中,在無需根據語言模型進行重新排列的情況下,可對錯誤的語音識別結果進行糾正。
根據用于實現上述目的的本發明的另一個實施例的語音識別錯誤糾正裝置,其包括:處理部,其以通過正確答案語料庫以及領域語料庫學習的語言模型為基礎,對語音識別結果的錯誤可能性進行判斷,并且在錯誤可能性大于事先定義的基準的情況下,根據正確答案語料庫以及語音識別結果是否相匹配生成平行語料庫,并且以平行語料庫為基礎生成語音識別模型,并且以語音識別模型以及語言模型為基礎對錯誤的語音識別結果進行糾正;存儲部,其對上述處理部中所處理的信息以及已處理的信息進行存儲。
在此,所述處理部根據語音識別結果的生成概率對語音識別結果的錯誤可能性進行判斷。
在此,所述處理部從正確答案語料庫以及語音識別結果中對正確答案集進行檢測,并且從正確答案語料庫以及語音識別結果中對錯誤答案集進行檢測,并且以正確答案語料庫、語音識別結果、正確答案集以及錯誤答案集為基礎生成平行語料庫。
所述處理部從平行語料庫中對語音識別前的第一語法進行檢測,并且從平行語料庫中對語音識別后的第二語法進行檢測,并且對第一語法和第二語法之間的語音識別概率進行計算,并且以第一語法、第二語法以及語音識別概率為基礎生成所述語音識別模型。
在此,所述處理部對根據第一語法和第二語法之間的對應關系生成圖表,并且從所述圖表中對具有最小錯誤的路徑進行檢測,并且以檢測到的路徑為基礎,對錯誤的語音識別結果進行糾正。
在此,所述處理部在不存在對應于第二語法的第一語法的情況下,將第二語法假設為第一語法,從而生成所述圖表。
在此,所述處理部在無需根據語言模型進行重新排列的情況下,對錯誤的語音識別結果進行糾正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浦項工科大學校產學協力團,未經浦項工科大學校產學協力團許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310604269.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種粘紅酵母生物肥料的制備方法及應用
- 下一篇:等離子有機廢氣凈化器箱體





