[發明專利]意圖識別方法、裝置、設備及存儲介質有效
| 申請號: | 201810540100.1 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108874917B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 郝杰 | 申請(專利權)人: | 北京五八信息技術有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/211;G06F40/30;G06F40/289;G06F40/186 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 焉明濤 |
| 地址: | 100083 北京市海淀區學清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種意圖識別方法、裝置、設備及存儲介質,所述意圖識別方法包括:響應意圖數據;根據由預先生成的詞法模板和句法模板編譯成的基于文檔的問答DBQA模板,對所述意圖數據進行匹配;根據匹配的結果,識別所述意圖數據所表示的語義。本發明有效提高了用戶意圖識別的準確率,有效降低了DBQA模板的實現復雜度,有效提高了編譯效率。
技術領域
本發明涉及計算機領域,特別是涉及一種意圖識別方法、裝置、設備及存儲介質。
背景技術
現有的DBQA(Document-Base Question Answering,基于文檔的問答)系統或智能客服系統一般結合機器學習和自然語言處理兩種技術,或利用EBQA將用戶輸入句子和知識庫中的句子進行字面的硬匹配;或利用單一的Fasttext文本分類技術、基于多粒度特征序列融合的BOWSA(Bag-Of-Words Semantic Analysis,詞袋語義分析)方法來識別用戶輸入文本的意圖。
但是,現有DBQA系統或智能客服系統實現復雜,并且對于用戶意圖識別的準確率有待提高。
發明內容
為了克服上述缺陷,本發明要解決的技術問題是提供一種意圖識別方法、裝置、設備及存儲介質,用以至少提高用戶意圖識別的準確率。
為解決上述技術問題,本發明實施例中的一種意圖識別方法,包括:
響應意圖數據;
根據由預先生成的詞法模板和句法模板編譯成的基于文檔的問答DBQA模板,對所述意圖數據進行匹配;
根據匹配的結果,識別所述意圖數據所表示的語義。
可選地,所述詞法模板包括多個詞條模板;其中,每個詞條模板包括用于描述預設的標準含義的目標字符串和與所述目標字符串對應的目標字符串集合;所述目標字符串集合包括與所述標準含義的意義相同、相近或關聯的字符串;
所述句法模板包括預設的多個標準問題以及在每個標準問題下的一個或多個句型模板;其中,每個句型模板由引用運算符和與所述每個標準問題相關的目標字符串構成。
可選地,所述根據由預先生成的詞法模板和句法模板編譯成的基于文檔的問答DBQA模板,對所述意圖數據進行匹配之前,包括:
根據每個標準含義,獲取與所述每個標準含義對應的目標字符串和目標字符串集合;
在所述對應的目標字符串和所述對應的目標字符串集合之間設置賦值運算符,以建立每個目標字符串的詞條模板;
根據建立的各個目標字符串的詞條模板生成所述詞法模板。
可選地,所述在所述對應的目標字符串和所述對應的目標字符串集合之間設置賦值運算符之后,包括:
在所述對應的目標字符串集合中的各個字符串之間設置或運算符。
可選地,所述在所述對應的目標字符串集合中的各個字符串之間設置或運算符之后,包括:
對所述對應的目標字符串集合中的一個或多個字符串設置正則運算符;
其中,每個字符串包括以下一種或多種:詞、詞組、多個詞組的組合、字符串和多個字符串的組合;所述每個字符串的類型包括以下一種或多種:句型詞、功能詞、虛詞、標點、實體詞、前置否定詞和后置否定詞;與所述每個目標字符串相應的詞條模板為一個或多個。
可選地,所述根據由預先生成的詞法模板和句法模板編譯成的基于文檔的問答DBQA模板,對所述意圖數據進行匹配之前,包括:
獲取與所述每個標準問題相關的目標字符串;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京五八信息技術有限公司,未經北京五八信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810540100.1/2.html,轉載請聲明來源鉆瓜專利網。





