[發明專利]用于語義識別的實體獲取方法、裝置、設備及存儲介質有效
| 申請號: | 202010931247.0 | 申請日: | 2020-09-07 |
| 公開(公告)號: | CN112084779B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 朱俊祺 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/35;G06F16/35;G06N3/0464;G06N3/08 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語義 識別 實體 獲取 方法 裝置 設備 存儲 介質 | ||
本申請實施例屬于人工智能領域,涉及一種用于語義識別的實體獲取方法、裝置、計算機設備及存儲介質,此外,本申請還涉及區塊鏈技術,用戶的用戶當前語句信息可存儲于區塊鏈中。該用于語義識別的實體獲取方法基于用戶輸入的當前語句信息,再結合與該當前語句信息相對應的機器上輪語句信息進行語義識別,并利用預訓練網絡,細粒度地抽取到用戶語句和智能終端語句語義和詞法上的特征,最后進行NER抽取。能夠有效提高模型對于不同語義角色的實體判斷,提升實體獲取的準確性。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種用于語義識別的實體獲取方法、裝置、計算機設備及存儲介質。
背景技術
智能對話是體現人工智能的重要領域,人類天生具有分析對話狀態、主題、語氣的能力,而智能體實現這些功能需要耗費巨大的開發量,因此通過深度學習模型來學習對話中潛在的交互信息,能夠有效提高智能體的學習效果和效率。
現有一種語義實體獲取方法,通過分析用戶當前輸入的語義內容信息,基于實體信息抽取、意圖識別和對話狀態管理達到獲取語義實體的目的,系統開發方需要歸納完成場景任務所需要的實體信息,這些信息就是對話系統的槽位。同時,為了應對用戶可能說的話,需要梳理用戶可能表達的意圖。系統根據用戶提供的實體信息和意圖狀態,決定智能終端對用戶采取追問或者提供信息等動作。
然而,傳統的語義實體獲取方法普遍不智能,在實際應用中,當用戶輸入的語義信息存在多種含義時,例如“美味源餐館”,該“美味源餐館”既可以是實體商鋪,也可以是地址信息,通過傳統的語義實體獲取方法無法獲知用戶實際輸入的語義信息,從而導致語義實體識別的準確性無法得到保障,即傳統的語義實體獲取方法存在準確性較低。
發明內容
本申請實施例的目的在于提出一種用于語義識別的實體獲取方法、裝置、計算機設備及存儲介質,以解決傳統的語義實體獲取方法準確性較低的問題。
為了解決上述技術問題,本申請實施例提供一種用于語義識別的實體獲取方法,采用了如下所述的技術方案:
獲取語句采集裝置發送的用戶當前語句信息;
獲取與所述當前語句信息相對應的機器上輪語句信息;
將所述用戶當前語句信息以及機器上輪語句信息輸入至預訓練模型進行編碼操作,獲取用戶語句向量矩陣以及機器上輪語句向量;
將所述機器上輪語句向量作為條件語義,并基于注意力機制獲取與所述用戶當前語句信息相對應的條件性句子向量;
基于所述條件性句子向量構建殘差網絡,獲取殘差向量;
將所述殘差向量以及所述用戶語句向量矩陣進行拼接操作,獲得目標向量矩陣;
將所述目標向量矩陣輸入至CRF層進行實體識別操作,獲取目標實體數據。
為了解決上述技術問題,本申請實施例還提供用于語義識別的實體獲取裝置,采用了如下所述的技術方案:
用戶信息獲取模塊,用于獲取語句采集裝置發送的用戶當前語句信息;
機器信息獲取模塊,用于獲取與所述當前語句信息相對應的機器上輪語句信息;
編碼模塊,用于將所述用戶當前語句信息以及機器上輪語句信息輸入至預訓練模型進行編碼操作,獲取用戶語句向量矩陣以及機器上輪語句向量;
句子向量獲取模塊,用于將所述機器上輪語句向量作為條件語義,并基于注意力機制獲取與所述用戶當前語句信息相對應的條件性句子向量;
殘差向量獲取模塊,用于基于所述條件性句子向量構建殘差網絡,獲取殘差向量;
向量矩陣獲取模塊,用于將所述殘差向量以及所述用戶語句向量矩陣進行拼接操作,獲得目標向量矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010931247.0/2.html,轉載請聲明來源鉆瓜專利網。





