[發明專利]一種調整語義邏輯混亂的語料的方法及系統有效
| 申請號: | 201811326950.8 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN109545202B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 魏譽熒 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/26;G06F40/289;G06F40/30 |
| 代理公司: | 上海碩力知識產權代理事務所(普通合伙) 31251 | 代理人: | 郭桂峰 |
| 地址: | 523851 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 調整 語義 邏輯 混亂 語料 方法 系統 | ||
本發明提供了一種調整語義邏輯混亂的語料的方法及系統,其方法包括:獲取邏輯清晰、語義完整的語料樣本,根據所述語料樣本建立語音庫、語義槽和正則表達式庫;獲取用戶語音;將所述用戶語音和所述語音庫進行匹配,得到匹配分詞,所述匹配分詞為所述用戶語音中匹配結果相符的分詞;根據所述語義槽確定所述匹配分詞對應的匹配分詞詞性;根據所述正則表達式庫中的正則表達式和所述匹配分詞詞性調整所述用戶語音中分詞的位置,得到邏輯正確的文本數據;根據所述文本數據進行語義解析。本發明通過調整邏輯混亂的語料中分詞之間的相對位置,從而智能識別真實的用戶意圖。
技術領域
本發明涉及語音識別技術領域,尤指一種調整語義邏輯混亂的語料的方法及系統。
背景技術
當今社會隨著互聯網的快速發展,人們的日常生活的方方面面也是變得越來越智能化,因此人們也越來越習慣地使用智能終端完成各種需求。而且隨著人工智能相關技術的日益成熟,各類終端的智能化程度也越來越高。語音交互作為智能終端中人機交互主流的交流應用之一,也是越來越受到用戶的青睞。
智能終端都是基于用戶輸入的語音進行識別,然后采取相應的措施,因此用戶通過終端終端所輸入的語音的準確性嚴重影響著智能終端所作出的反饋。
由于用戶輸入語音過程中可能出現的意外,例如用戶輸入語音時比較著急,來不及理清邏輯,說話語無倫次,導致輸入的語音邏輯比較混亂,或者用戶自身對于自己描述的事物并不了解或者只理解一部分,導致輸入語音描述時不知道如何組織語言進行清晰說明。對于上述獲取的語音出現邏輯混亂的現象,如果直接對獲取的語音進行識別解析難以準確識別用戶的真實意圖。
另外,對于小學低年級的學生而言,由于他們還是處于剛剛開始學習的階段,對于字、詞、句的理解都還不夠深入,并不能準確運用,導致自身的語言表達能力比較薄弱。因此他們在表達過程中,經常會出現語義邏輯混亂、意圖不清晰的情況,導致語音識別產品難以智能識別真實的用戶意圖。
因此市場上急需一種能夠識別用戶語音邏輯混亂并進行相應調整的方法及系統。
發明內容
本發明的目的是提供一種調整語義邏輯混亂的語料的方法及系統,實現通過調整邏輯混亂的語料中分詞之間的相對位置,從而智能識別真實的用戶意圖的目的。
本發明提供的技術方案如下:
本發明提供了一種調整語義邏輯混亂的語料的方法,其特征在于,包括:
獲取邏輯清晰、語義完整的語料樣本,根據所述語料樣本建立語音庫、語義槽和正則表達式庫;
獲取用戶語音;
將所述用戶語音和所述語音庫進行匹配,得到匹配分詞,所述匹配分詞為所述用戶語音中和所述語音庫匹配結果相符的分詞;
根據所述語義槽確定所述匹配分詞對應的匹配分詞詞性;
根據所述正則表達式庫中的正則表達式和所述匹配分詞詞性調整所述用戶語音中分詞的相對位置,得到邏輯正確的文本數據;
根據所述文本數據進行語義解析。
進一步的,所述的獲取邏輯清晰、語義完整的語料樣本,根據所述語料樣本建立語音庫、語義槽和正則表達式庫具體包括:
獲取邏輯清晰、語義完整的所述語料樣本;
通過分詞技術對所述語料樣本進行分詞得到所述語料樣本中包含的樣本分詞以及對應的樣本分詞詞性;
根據所述樣本分詞和所述樣本分詞詞性建立所述語義槽;
獲取所述樣本分詞對應的樣本分詞音頻,根據所述樣本分詞音頻建立語音庫;
根據所述語料樣本和所述樣本分詞詞性總結得出正則表達式,根據所述正則表達式建立所述正則表達式庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811326950.8/2.html,轉載請聲明來源鉆瓜專利網。





