[發明專利]智能應答系統、啟動方法、裝置及存儲介質在審
| 申請號: | 202110921158.2 | 申請日: | 2021-08-11 |
| 公開(公告)號: | CN113779212A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 馬浩;劉丹 | 申請(專利權)人: | 京東科技信息技術有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G06F16/36;G06F40/279 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 孫劍鋒 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 應答 系統 啟動 方法 裝置 存儲 介質 | ||
本發明提供一種智能應答系統、啟動方法、裝置及存儲介質,用以自動生成意圖類別對應的正則表達式和相似語料,從而提高智能應答系統冷啟動的效率。該智能應答系統的啟動方法包括:對于所述智能應答系統中預定義的每一種意圖類別,執行如下操作:獲取所述意圖類別的標準問題信息和所述標準問題信息中的關鍵詞;采用分詞算法,將所述標準問題信息按詞性進行分詞,并以詞為單元進行同義詞替換,得到替換后語料集;基于所述替換后語料集生成所述意圖類別對應的相似語料,以及基于所述替換后語料集和所述標準問題信息中的關鍵詞生成所述意圖類別對應的正則表達式。
技術領域
本發明涉及數據分類技術領域,尤其涉及一種智能應答系統、啟動方法、裝置及存儲介質。
背景技術
智能應答系統通常包括自然語言理解系統(Natural Language Understanding,NLU)和對話管理系統(DM),NLU系統的主要功能是將用戶意圖進行識別歸類,DM系統的主要功能是基于NLU系統的識別結果,確定應答內容并推送。
在智能應答系統上線后,并擁有大量的標注數據時,就可以通過訓練自然語言理解模型作為NLU系統,以用來識別用戶的意圖類別,但在智能應答系統的冷啟動階段,由于擁有的標注數據數量有限,還無法訓練精確的自然語言理解模型。
因此,在智能應答系統的冷啟動階段,目前是運營按照業務需求在業務預定義的意圖分類體系中,為每個意圖類別配置正則表達式和相似語料,通過正則表達式匹配和/或相似語料匹配,來實現用戶意圖分類,如下表一所示。
表一
然而,運營配置正則表達式存在技術門檻,需要學習正則語法才能配置,對于每個意圖類別通常需要梳理上千條相似語料,相似語料梳理緩慢,因此,現有的正則表達式和相似語料的配置難度和費力度高,導致智能應答系統冷啟動的效率低。
發明內容
有鑒于此,本發明提供一種智能應答系統、啟動方法、裝置及存儲介質,用以自動生成意圖類別對應的正則表達式和相似語料,從而提高智能應答系統冷啟動的效率。
具體地,本發明是通過如下技術方案實現的:
根據本發明的第一方面,提供一種智能應答系統的啟動方法,所述方法包括:
對于所述智能應答系統中預定義的每一種意圖類別,執行如下操作:
獲取所述意圖類別的標準問題信息和所述標準問題信息中的關鍵詞;
采用分詞算法,將所述標準問題信息按詞性進行分詞,并以詞為單元進行同義詞替換,得到替換后語料集;
基于所述替換后語料集生成所述意圖類別對應的相似語料,以及基于所述替換后語料集和所述標準問題信息中的關鍵詞生成所述意圖類別對應的正則表達式。
在一些實施例中,所述以詞為單元進行同義詞替換,得到替換后語料集,包括:
以詞為單元進行同義詞替換,并做笛卡兒積的交叉組合,得到替換后語料集。
在一些實施例中,所述基于所述替換后語料集生成所述意圖類別對應的相似語料,包括:
基于所述替換后語料集生成備選語料集;
對于所述備選語料集中的每一備選語料,調用已有的相似匹配模型將所述備選語料與所述標準問題信息進行相似度匹配;
若兩者的相似度高于設定的相似閾值,則將所述備選語料作為所述意圖類別對應的相似語料,并存儲到第一預設數據庫中。
在一些實施例中,所述基于所述替換后語料集生成備選語料集,包括:
將所述替換后語料集作為備選語料集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技信息技術有限公司,未經京東科技信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110921158.2/2.html,轉載請聲明來源鉆瓜專利網。





