[發明專利]一種語音單詞拼寫識別方法、設備及存儲介質有效
| 申請號: | 201811501529.6 | 申請日: | 2018-12-10 |
| 公開(公告)號: | CN109448717B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 葉軍 | 申請(專利權)人: | 深圳普得技術有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L17/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 單詞 拼寫 識別 方法 設備 存儲 介質 | ||
本發明公開了一種語音單詞拼寫識別方法、設備及存儲介質,其中,所述語音單詞拼寫識別通過獲取待輸入的目標單詞并輸出語音拼寫提示信息;之后接收用戶輸入的單詞拼寫信息,對所述單詞拼寫信息進行語音識別獲取當前錄入單詞的原始識別結果;之后根據所述原始識別結果中每個字母的識別參數對所述原始識別結果與目標單詞進行計算匹配,判斷是否拼寫正確并反饋拼寫結果。通過獲取用戶錄入單詞的原始識別結果并結合該結果中每個字母的識別參數進行計算匹配,消除了由于單純字母語音識別準確度不高導致的單詞拼寫判斷偏差,確保用戶在進行語音單詞拼寫時的判斷精確性,有效提高了人機交互的智能化程度。
技術領域
本發明涉及語音識別技術領域,具體涉及一種語音單詞拼寫識別方法、設備及存儲介質。
背景技術
隨著人工智能技術的不斷發展,機器的功能越來越強,智能化程度越來越高,在英語教育領域,近期出現更多基于人工智能技術的教育方法,包括手機App、機器人、專業設備等。其中,純語音的練習也占據越來越高的地位,在國內英語的教育改革中,口語和聽力的比例也逐漸提高,重視培養能說能交流的英語人才。
在英語學習中,單詞拼寫和交互練習是剛需。但是,機器識別字母一直是人工智能領域的難題,主要的原因是字母的音頻很短,在技術上稱為“維度短”。同時,很多字母的發音很相近,例如,“E”、“D”、“B”、“T”、“P”、“Z”,進一步造成精準識別的難度上升。
現有的字母識別技術主要服務于電話自動客服系統,例如針對電話系統實現簡單的A/B/C的語音識別,或者為了解決字母識別問題使用文字替代字母,如用“Alpha”替代“A”等等,但均無法針對超短音頻或相近字母進行精確的語音識別,進而十分影響用戶在進行語音單詞拼寫交互練習時的準確性。
因此,現有技術還有待于改進和發展。
發明內容
鑒于上述現有技術的不足之處,本發明的目的在于提供一種語音單詞拼寫識別方法、設備及存儲介質,解決了目前由于無法準確識別字母語音,導致在人機交互單詞拼寫練習中拼寫判斷準確性低的問題。
為了達到上述目的,本發明采取了以下技術方案:
一種語音單詞拼寫識別方法,其包括如下步驟:
獲取待輸入的目標單詞并輸出語音拼寫提示信息;
接收用戶輸入的單詞拼寫信息,對所述單詞拼寫信息進行語音識別獲取當前錄入單詞的原始識別結果;
根據所述原始識別結果中每個字母的識別參數對所述原始識別結果與目標單詞進行計算匹配,判斷是否拼寫正確并反饋拼寫結果。
所述的語音單詞拼寫識別方法中,所述接收用戶輸入的單詞拼寫信息,對所述單詞拼寫信息進行語音識別獲取當前錄入單詞的原始識別結果的步驟包括:
開啟錄音功能,錄入用戶輸入的單詞拼寫信息;
判斷所述單詞拼寫信息是否完成錄入,若是,則對完整的單詞拼寫信息進行語音識別獲取當前錄入單詞的原始識別結果。
所述的語音單詞拼寫識別方法中,所述接收用戶輸入的單詞拼寫信息,對所述單詞拼寫信息進行語音識別獲取當前錄入單詞的原始識別結果的步驟包括:
開啟錄音功能,錄入用戶輸入的單詞語音信息;
對所述單詞拼寫信息進行實時語音識別,獲取當前錄入單詞的原始識別結果,直到所述單詞拼寫信息完成錄入。
所述的語音單詞拼寫識別方法中,所述根據所述原始識別結果中每個字母的識別參數對所述原始識別結果與目標單詞進行計算匹配,判斷是否拼寫正確并反饋拼寫結果的步驟包括:
判斷所述目標單詞中的字母是否按順序包含于所述原始識別結果中;若是,則繼續進行拼寫判斷,否則反饋拼寫錯誤;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳普得技術有限公司,未經深圳普得技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811501529.6/2.html,轉載請聲明來源鉆瓜專利網。





