[發明專利]語義理解方法、裝置、電子設備和存儲介質在審
| 申請號: | 202011455490.6 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112560497A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 洪建;劉權;陳志剛;華磊 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 理解 方法 裝置 電子設備 存儲 介質 | ||
1.一種語義理解方法,其特征在于,包括:
確定待理解的文本;
將所述文本及其句法結構輸入至語義理解模型,得到所述語義理解模型輸出的語義理解結果;
其中,所述語義理解模型基于所述文本中各個字之間的關系和所述文本的句法結構,確定所述文本中各個分詞之間的關系,并基于各個分詞之間的關系對所述文本進行語義理解;
所述語義理解模型是基于樣本文本及其樣本句法結構和樣本語義理解結構訓練得到的。
2.根據權利要求1所述的語義理解方法,其特征在于,所述將所述文本及其句法結構輸入至語義理解模型,得到所述語義理解模型輸出的語義理解結果,具體包括:
將所述文本中每個字的字編碼特征輸入至所述語義理解模型的字關聯層,得到所述字關聯層輸出的所述文本中每個字的字關聯特征,任一字的字關聯特征表征所述任一字與所述文本中的其余每個字之間的關系;
將每個字的字關聯特征和所述文本的句法結構輸入至所述語義理解模型的詞關聯層,得到所述詞關聯層輸出的所述文本中每個分詞的詞關聯特征,任一分詞的詞關聯特征表征所述任一分詞與所述文本中的其余分詞之間的關系;
將每個字的字編碼特征以及每個分詞的詞關聯特征輸入至所述語義理解模型的語義理解層中,得到所述語義理解層輸出的語義理解結果。
3.根據權利要求2所述的語義理解方法,其特征在于,所述將每個字的字關聯特征和所述文本的句法結構輸入至所述語義理解模型的詞關聯層,得到所述詞關聯層輸出的所述文本中每個分詞的詞關聯特征,具體包括:
將屬于所述文本中任一分詞的每個字的字關聯特征輸入至所述詞關聯層的詞特征整合層,得到所述詞特征整合層輸出的所述任一分詞的詞整合特征;
將所述文本中每個分詞的詞整合特征和所述文本的句法結構輸入至所述詞關聯層的關聯加強層,得到所述關聯加強層輸出的每個分詞的詞關聯特征。
4.根據權利要求3所述的語義理解方法,其特征在于,所述將屬于所述文本中任一分詞的每個字的字關聯特征輸入至所述詞關聯層的詞特征整合層,得到所述詞特征整合層輸出的所述任一分詞的詞整合特征,具體包括:
將屬于所述文本中任一分詞的每個字的字關聯特征輸入至所述詞特征整合層,由所述詞特征整合層對所述任一分詞的每個字的字關聯特征進行池化,將池化結果賦值給所述任一分詞中的每個字,得到所述詞特征整合層輸出的所述任一分詞中每個字的池化結果作為所述任一分詞的詞整合特征。
5.根據權利要求2所述的語義理解方法,其特征在于,所述將每個字的字編碼特征以及每個分詞的詞關聯特征輸入至所述語義理解模型的語義理解層中,得到所述語義理解層輸出的語義理解結果,具體包括:
將每個字的字編碼特征以及每個分詞的詞關聯特征輸入至所述語義理解層的關聯編碼層,由所述關聯編碼層基于每個分詞的詞關聯特征對每個字的字編碼特征進行關聯增強,得到所述關聯編碼層輸出的每個字的關聯編碼特征;
將每個字的關聯編碼特征,或者每個字的關聯編碼特征和字編碼特征輸入至所述語義理解層的結果輸出層,得到所述結果輸出層輸出的語義理解結果。
6.根據權利要求1至5中任一項所述的語義理解方法,其特征在于,所述句法結構是基于如下步驟確定的:
對所述文本進行句法分析,得到所述文本中每個分詞之間的句法依賴關系;
基于每個分詞之間的句法依賴關系,構建表征所述文本中每個字所屬分詞與其他字所屬分詞之間的句法依賴關系的矩陣,作為所述句法結構。
7.根據權利要求2至5中任一項所述的語義理解方法,其特征在于,每個字的字編碼特征是基于語言表示模型BERT編碼得到的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011455490.6/1.html,轉載請聲明來源鉆瓜專利網。





