[發明專利]一種基于混合策略的復句用戶查詢語句的意圖識別方法在審
| 申請號: | 201910371479.2 | 申請日: | 2019-05-06 |
| 公開(公告)號: | CN110096595A | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 繆煒;高丹;王東東 | 申請(專利權)人: | 上海互問信息科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/332 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200135 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶查詢 意圖識別 分句 語句 集合 混合策略 對話系統 邏輯判斷 系統生成 性能提升 用戶體驗 用戶意圖 語法規則 語言符號 準確度 傳統的 回復 解析 智能 研究 | ||
1.一種基于混合策略的復句用戶查詢語句的意圖識別方法,其特征在于:包括以下步驟:
步驟1,根據用戶查詢復句q,利用語言符號、復句語法規則逐步獲取、解析用戶查詢復句q相對應的候選分句集合C;
步驟2,利用傳統的用戶查詢語句的意圖識別模型分別對用戶查詢復句q、用戶輸入分句集合C進行意圖識別,獲取用戶查詢復句的候選意圖Iq、候選分句意圖集合IC;
步驟3,將用戶查詢復句的意圖Iq與候選分句的意圖集合IC進行邏輯判斷;若用戶查詢復句的意圖Iq與候選分句的意圖集合IC均相同,則用戶查詢復句的意圖Iq作為對話系統的意圖識別結果輸出;若用戶查詢復句的意圖Iq與候選分句的意圖集合IC的某一個意圖不同,則利用意圖集合{Iq,IC}中各意圖的置信度θ進行判斷,獲得最終的對話系統意圖識別結果。
2.根據權利要求1所述的基于混合策略的復句用戶查詢語句的意圖識別方法,其特征在于:所述步驟1中根據用戶查詢復句q,用于逐步獲取、解析用戶查詢復句q相對應的候選分句集合C的語言符號規則、復句語法規則,包括對復句進行以下處理:
總結能夠對中文文本片段進行斷句的標點符號,生成語言符號模板Ts=\p{Po},進而對用戶查詢復句q進行切分得到初級候選分句集合P={Pi|i=1,2,...,n};
基于復句的基本類型,生成復句語法規則模板集合TC={TCj|j=1,2,…,m},模板TCj的格式如下,TCj=label#模板=并列#(?<txt1>.+)(又|也|后|且|并|再)(?<txt2>.+)其中,label表示復句的基本類型,模板用于提取候選分句C1=txt1、C2=txt2;
利用復句語法規則模板TC對上述初級候選分句集合P中的每一個候選分句Pi進行處理,得到用戶查詢復句q的候選分句集合IC以及分句之間所表示的復句類型label。
3.根據權利要求1所述的基于混合策略的復句用戶查詢語句的意圖識別方法,其特征在于:所述步驟2中對用戶查詢復句q、用戶輸入分句集合C進行意圖識別的傳統的用戶查詢語句的意圖識別模型包括利用語義規則模板與機器學習算法的分類模型所構成的用戶查詢語句的意圖識別方法、裝置,并且根據語法規則模板得到的候選意圖識別結果的置信度θ=1.0,利用機器學習算法的分類模型所得到的候選意圖識別結果的置信度θ<1.0。
4.根據權利要求1所述的基于混合策略的復句用戶查詢語句的意圖識別方法,其特征在于:所述步驟3中用戶查詢復句的意圖Iq與候選分句的意圖集合IC的某一個意圖不同時利用意圖集合{Iq,IC}中各意圖的得分進行判斷,獲得最終的對話系統意圖識別結果的過程包括以下處理:
刪除意圖集合IC中意圖識別結果Ii為聊天意圖的意圖元素以及置信度θ<1.0的意圖元素Ii,得到意圖集合IC';
當或者IC'中所有意圖元素的置信度均小于1.0(即{θIi<1.0|Ii∈IC'})時,返回用戶查詢復句的意圖Iq;
當用戶查詢復句的意圖Iq置信度時,根據IC'中各意圖元素的相應的復句基本類型label確定最終返回的意圖識別結果。
5.根據權利要求4所述的基于混合策略的復句用戶查詢語句的意圖識別方法,其特征在于:候選分句{Ci,Cj|i≠j}的復句基本類型labelCi,Cj=“轉折”,輸出候選分句Cj的意圖識別結果ICj;否則,IC'作為用戶輸入復句的意圖識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海互問信息科技有限公司,未經上海互問信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910371479.2/1.html,轉載請聲明來源鉆瓜專利網。





