[發明專利]一種提高語音識別準確率的方法與系統在審
| 申請號: | 202310472717.5 | 申請日: | 2023-04-27 |
| 公開(公告)號: | CN116386616A | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 劉斌 | 申請(專利權)人: | 齊魯師范學院 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/26;G10L15/04 |
| 代理公司: | 嘉興亮典知識產權代理有限公司 33521 | 代理人: | 呂梅 |
| 地址: | 250200*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 語音 識別 準確率 方法 系統 | ||
本發明公開了一種提高語音識別準確率的方法與系統,該方法包括:獲取用戶的錄音信息,生成語音文本信息,判斷所述語音文本信息與標準語音文本信息的匹配度,以得到第一匹配結果和第二匹配結果,基于所述第一匹配結果對所述錄音信息進行處理并生成調整文本信息,基于第二匹配結果對所述語音文本信息和所述標準語音文本信息進行分割并生成第一分割文本信息和第二分割文本信息,篩選第一分割文本信息與第二分割文本信息中的差異值,對所述差異值進行調整,本發明公開的方法與系統相結合,對語音識別系統進行了完善,提高了語音識別系統的準確率。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種提高語音識別準確率的方法與系統。
背景技術
隨著信息技術的發展,越來越多的電子設備中運用了語音識別技術,如導航上的語音搜索應用、語音轉換發送短信、微信語音轉換文字等,為人們提供了諸多的便利,減少了人們手動文字輸入的工作量,節省了時間。
現有技術中,通過采集語音振源數據轉換為語音信息進行語音識別,減少語音識別系統因環境嘈雜、發音不清晰等導致的語音獲取數據不完整的問題,但無法排除多個用戶發生同時同步電子設備輸入語音信息,而造成語音識別混亂的情況,也無法大概率的避免語音識別系統的在識別語音信息的轉換過程中造成語音識別的不精確性,以致反饋出的語音識別結果與用戶所輸入的語音數據不匹配,需要用戶再次輸入語音信息,浪費了再次獲取用戶語音信息的時間,以及再次經過語音識別系統輸出的識別結果出錯率依然較高,因此,對語音識別系統的語音識別校正過程還有待完善。
發明內容
為了解決上述語音音色識別不清晰和降低字詞大概率錯誤的問題,本申請提供一種提高語音識別的方法與系統。
第一方面,提供一種提高語音識別的方法,所述方法包括:
獲取用戶的錄音信息并生成語音文本信息;
判斷所述語音文本信息與標準語音文本信息的匹配度,以得到第一匹配結果和第二匹配結果;
基于所述第一匹配結果對所述錄音信息進行處理并生成調整文本信息;
基于第二匹配結果對所述語音文本信息和所述標準語音文本信息進行分割并生成第一分割文本信息和第二分割文本信息;
篩選第一分割文本信息與第二分割文本信息中的差異值,對所述差異值進行調整。
通過采用上述技術方案,通過獲取用戶的錄音信息,以生成語音文本信息,語音文本信息與標準語音文本信息進行匹配,并判斷其匹配度,以得到第一匹配結果和第二匹配結果,對第一匹配結果和第二匹配結果進行分別處理,根據第一匹配結果以對用戶的錄音信息進行調整,從而生成調整文本信息,根據第二匹配結果以對語音文本信息進行分割,且對標準語音文本信息進行分割,進而得到第一分割文本信息和第二分割文本信息,將第一分割文本信息與第二分割文本信息進行比對,得到一個差異值,根據差異值進行調整。
優選的,所述用戶獲取語音文本信息,并將語音文本信息與標準語音文本信息進行匹配,其中所述標準語音文本信息由用戶所設定;
判斷語音文本信息與標準語音文本信息的匹配值;
設定第一匹配區間值和第二匹配區間值,若所述匹配值落入所述第一匹配區間值內,則輸出第一匹配結果,若所述匹配值落入第二匹配區間置內,則輸出第二匹配結果。
通過采用上述技術方案,將語音文本信息與由用戶所設定的標準語音文本信息進行匹配,得到一個匹配度,通過設定區間值,分為第一匹配區間值和第二匹配區間值,將匹配度與區間值進行比對,當匹配度落入第一匹配區間值時,輸出第一匹配結果,若落入第二匹配區間值,則輸出第二匹配結果。
優選的,所述第一匹配區間值設定為高匹配度區間值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于齊魯師范學院,未經齊魯師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310472717.5/2.html,轉載請聲明來源鉆瓜專利網。





