[發明專利]語義理解方法、裝置、電子設備和存儲介質在審
| 申請號: | 202011455490.6 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112560497A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 洪建;劉權;陳志剛;華磊 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 理解 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供一種語義理解方法、裝置、電子設備和存儲介質,該方法包括:確定待理解的文本;將所述文本及其句法結構輸入至語義理解模型,得到所述語義理解模型輸出的語義理解結果;其中,所述語義理解模型基于所述文本中各個字之間的關系和所述文本的句法結構,確定所述文本中各個分詞之間的關系,并基于各個分詞之間的關系對所述文本進行語義理解;所述語義理解模型是基于樣本文本及其樣本句法結構和樣本語義理解結構訓練得到的。本發明實施例提供的方法、裝置、電子設備和存儲介質,能夠從詞層面上提取文本中包含的語義信息,避免了傳統的語義理解模型以字為單元進行建模導致語義信息遺漏的問題,提高了語義理解的準確性。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種語義理解方法、裝置、電子設備和存儲介質。
背景技術
隨著人工智能技術的迅猛發展,以智能語音交互為核心的人機交互系統的應用越來越廣泛,例如,智能家居、智能客服、聊天機器人、早教機器人等。要實現人機交互,機器需要對用戶輸入的語料進行語義理解。
語義理解是指,機器依據用戶給出的自然語言,理解出用戶的意圖,進一步地,還可以做出相應的操作。目前,語義理解多通過預訓練的深度學習模型實現。而通用的深度學習模型多是以字為基礎單元進行建模的,并不符合中文的用語習慣,存在語義信息的損失,導致語義理解的準確性偏低。
發明內容
本發明實施例提供一種語義理解方法、裝置、電子設備和存儲介質,用以解決現有技術中語義理解存在語義信息的損失,導致準確性低的缺陷。
第一方面,本發明實施例提供一種語義理解方法,包括:
確定待理解的文本;
將所述文本及其句法結構輸入至語義理解模型,得到所述語義理解模型輸出的語義理解結果;
其中,所述語義理解模型基于所述文本中各個字之間的關系和所述文本的句法結構,確定所述文本中各個分詞之間的關系,并基于各個分詞之間的關系對所述文本進行語義理解;
所述語義理解模型是基于樣本文本及其樣本句法結構和樣本語義理解結構訓練得到的。
可選地,所述將所述文本及其句法結構輸入至語義理解模型,得到所述語義理解模型輸出的語義理解結果,具體包括:
將所述文本中每個字的字編碼特征輸入至所述語義理解模型的字關聯層,得到所述字關聯層輸出的所述文本中每個字的字關聯特征,任一字的字關聯特征表征所述任一字與所述文本中的其余每個字之間的關系;
將每個字的字關聯特征和所述文本的句法結構輸入至所述語義理解模型的詞關聯層,得到所述詞關聯層輸出的所述文本中每個分詞的詞關聯特征,任一分詞的詞關聯特征表征所述任一分詞與所述文本中的其余分詞之間的關系;
將每個字的字編碼特征以及每個分詞的詞關聯特征輸入至所述語義理解模型的語義理解層中,得到所述語義理解層輸出的語義理解結果。
可選地,所述將每個字的字關聯特征和所述文本的句法結構輸入至所述語義理解模型的詞關聯層,得到所述詞關聯層輸出的所述文本中每個分詞的詞關聯特征,具體包括:
將屬于所述文本中任一分詞的每個字的字關聯特征輸入至所述詞關聯層的詞特征整合層,得到所述詞特征整合層輸出的所述任一分詞的詞整合特征;
將所述文本中每個分詞的詞整合特征和所述文本的句法結構輸入至所述詞關聯層的關聯加強層,得到所述關聯加強層輸出的每個分詞的詞關聯特征。
可選地,所述將屬于所述文本中任一分詞的每個字的字關聯特征輸入至所述詞關聯層的詞特征整合層,得到所述詞特征整合層輸出的所述任一分詞的詞整合特征,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011455490.6/2.html,轉載請聲明來源鉆瓜專利網。





