[發明專利]一種基于知識圖譜與語義圖技術的口語理解方法有效
| 申請號: | 201910315854.1 | 申請日: | 2019-04-19 |
| 公開(公告)號: | CN110188342B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 姜明;滕海濱;張旻;湯景凡;戚鋮杰;張雯 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/36;G06F16/35 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 語義 技術 口語 理解 方法 | ||
本發明公開了一種基于知識圖譜與語義圖技術進行口語理解的方法。本發明步驟:1.訓練序列到動作序列神經網絡模型,訓練基于句子和句子邏輯表達式的口語理解神經網絡;2.讀取需要被解析的自然語言句子;3.使用文本映射算法掃描并替換句子中與知識圖譜中語義資源相匹配的部分;4.使用序列到動作序列神經網絡模型讀取替換了語義資源后的句子,然后執行對應的動作序列生成與句子語義相符的語義圖,然后使用深度優先算法遍歷語義圖得到句子的邏輯表達式;5.使用口語理解神經網絡讀入句子和邏輯表達式,生成意圖信息和槽位信息。本發明提出結合知識圖譜和理解句子語義的方法進行口語解析。
技術領域
本發明涉及文本匹配領域,具體涉及一種基于知識圖譜與語義圖技術進行口語理解的方法,一種指定文本中檢測句子主旨與詳細要點的方法。
背景技術
人機對話系統需要識別人類語言中的信息,才能具體執行相應任務,如給問題作出回答、預定機票等等,這個過程也叫做口語解析。口語解析任務中,識別句子主旨的任務叫“意圖檢測”,根據意圖的不同從句子中篩選要求叫“槽位填充”。
隨著人工智能技術的發展,研究者們紛紛從傳統的最大熵馬爾可夫模型、條件隨機場等方案中轉移到各種基于神經網絡的模型上,取得了可喜的進步。但是這些工作往往著重于句子本身的結構信息,缺乏對句子語義的有效利用。同時,近些年來互聯網的迅猛擴張,知識庫和知識圖譜的容量和應用場景都有許多新的發展,這為如何利用知識圖譜當中的資源為自動對話系統服務帶來了新的幫助。我們提出的方法結合知識圖譜與語義圖技術,實現口語解析。
發明內容
本發明的目的是針對現有技術的不足,公開一種基于知識圖譜與語義圖技術的口語理解方法。
本發明解決其技術問題所采用的技術方案包括以下步驟:
步驟1、訓練序列到動作序列神經網絡模型,訓練基于句子和句子邏輯表達式的口語理解神經網絡;
步驟2、讀取需要被解析的自然語言句子;
步驟3、使用文本映射算法掃描并替換句子中與知識圖譜中語義資源相匹配的部分;
步驟4、使用序列到動作序列神經網絡模型讀取替換了語義資源后的句子,然后執行對應的動作序列生成與句子語義相符的語義圖,然后使用深度優先算法遍歷語義圖得到句子的邏輯表達式;
步驟5、使用口語理解神經網絡讀入句子和邏輯表達式,生成意圖信息和槽位信息。
步驟1中訓練的序列到動作序列神經網絡模型,包括如下步驟:
1-1.整理出已有的句子與邏輯表達式的關系作為樣本集;
1-2.解析句子邏輯表達式生成語義圖,對語義圖進行深度優先搜索生成構造語義圖的動作序列;
1-3.將句子本身與邏輯表達式生成的動作序列做對應,生成一個新的樣本集;
1-4.將句子與動作序列的樣本集,分割為比例為9∶1作為訓練集與測試集;訓練集送入一個序列到序列的神經網絡模型中,通過梯度下降算法調整模型參數,使得模型在測試集中的測試結果達到最優;
步驟1中所述的口語理解神經網絡,包括如下步驟:
(1-1)整理已有句子的邏輯表達式與句子的意圖信息和槽位信息做對應,整理為樣本集;
(1-2)同樣將樣本集分割為9∶1作為訓練集與測試集;
(1-3)使用口語理解神經網絡在訓練集中進行學習,然后在測試集中測試結果;調整參數使用梯度下降法,使得最終槽位信息和意圖信息達到盡可能準確。
步驟1或5中的口語理解模型,其特征在于,構建一個編碼器、解碼器結構的循環神經網絡,具體如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910315854.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種警情分析系統
- 下一篇:基于融合注意力網絡的多模態情感識別方法





