[發明專利]語義識別方法及裝置有效
| 申請號: | 201711397017.5 | 申請日: | 2017-12-21 |
| 公開(公告)號: | CN108133706B | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 張立新;周畢興 | 申請(專利權)人: | 深圳市沃特沃德股份有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G06F40/30 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市南山區蛇口*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 識別 方法 裝置 | ||
本發明提供了一種語義識別方法及裝置,包括獲取待識別的語音信息;識別所述語音信息中的每個單字語音的時長;將每個所述單字語音的時長與第一預設值進行對比;根據對比結果,在預設語義數據庫中匹配所述單字語音對應的語義;根據單字語音的時長識別每個單字語音,便于區分語音信息中的數字、字母以及符號,增加識別準確度。
技術領域
本發明涉及語音識別技術領域,特別涉及一種語義識別方法及裝置。
背景技術
語音識別的應用越來越廣泛,不僅在語音輸入法領域得到使用,在翻譯機、人工智能等應用上也日益廣泛。中文漢字不算聲調有400多個發音,同音不同字的情況大量存在。通常文字的內容識別可根據詞語組合或上下文的意思來推理聯想以提高準確率,但當識別毫無規律的數字、符號、字母時誤識別率較高,常常需要人工糾錯,而在無顯示屏和無鍵盤輸入裝置時比較難以進行糾錯操作,將會降低語音識別的準確率和識別效率。
發明內容
本發明的主要目的為提供一種語義識別方法及裝置,提升語義識別準確率。
本發明提出一種語義識別方法,包括以下步驟:
獲取待識別的語音信息;
識別所述語音信息中的每個單字語音的時長;
將每個所述單字語音的時長與第一預設值進行對比;
根據對比結果,在預設語義數據庫中匹配所述單字語音對應的語義。
進一步地,所述對比結果為所述單字語音的時長小于所述第一預設值,所述預設語義數據庫則為漢字語義庫,所述漢字語義庫包括預設單字語音及對應的預設漢字;
所述對比結果為所述單字語音的時長不小于所述第一預設值,所述預設語義數據庫則為特征字符語義庫,所述特征字符語義庫包括預設單字語音及對應的預設數字、字母以及符號中至少一種。
進一步地,所述在預設語義數據庫中匹配所述單字語音對應的語義的步驟之后包括:
監聽所述單字語音對應的語義是否匹配成功;
若不成功,則在所述漢字語義庫中匹配所述單字語音對應的語義。
進一步地,所述在預設語義數據庫中匹配所述單字語音對應的語義的步驟之后包括:
監測所述單字語音對應匹配的語義的數量;
若所述單字語音對應的語義為多個,則分析所述單字語音之前或之后的兩個單字語音對應的兩個語義在組合后是否為詞語;
若是,則分析所述詞語的意思;
從所述單字語音對應的多個語義中選擇與所述詞語的意思相關聯的語義。
進一步地,分析所述單字語音之前或之后的兩個單字語音對應的兩個語義在組合后是否為詞語的步驟包括:
將所述單字語音之前或之后的兩個單字語音對應的兩個語義進行組合;
分析預設的詞語數據庫中是否有與所述兩個語義相同的預設詞語;
若有,則將所述兩個語義判定為詞語。
本發明還提供了一種語義識別裝置,包括:
獲取單元,用于獲取待識別的語音信息;
第一識別單元,用于識別所述語音信息中的每個單字語音的時長;
對比單元,用于將每個所述單字語音的時長與第一預設值進行對比;
第二識別單元,用于根據對比結果,在預設語義數據庫中匹配所述單字語音對應的語義。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市沃特沃德股份有限公司,未經深圳市沃特沃德股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711397017.5/2.html,轉載請聲明來源鉆瓜專利網。





