[發明專利]一種基于意圖理解的服務調用方法和系統有效
| 申請號: | 201810569449.8 | 申請日: | 2018-06-05 |
| 公開(公告)號: | CN108874774B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 王功明;王建華;郭運艷;李明明;王本強 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/247 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜鵬 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 意圖 理解 服務 調用 方法 系統 | ||
本發明特別涉及一種基于意圖理解的服務調用方法和系統。該基于意圖理解的服務調用方法,通過構建基礎數據模型和處理工具,構建意圖理解模型,使用意圖理解模型處理用戶請求,綜合多種策略識別出實體,根據實體類型確定意圖類型,執行服務調用。該基于意圖理解的服務調用方法和系統,通過匹配用戶請求文本中的實體類型序列來判定意圖類型,簡單、可控、自然,易于工程化實現,符合大規模應用中的流式處理需要,既提高了命名實體識別的準確率,又提高了用戶請求文本中命名實體識別的召回率。
技術領域
本發明涉及任務型對話系統技術領域,特別涉及一種基于意圖理解的服務調用方法和系統。
背景技術
任務型對話系統可以根據用戶提出的請求,完成相應的任務,如買票、訂餐、購物、天氣查詢等,廣泛應用在蘋果Siri、微軟Cortana、百度度秘等語音助手中。其處理流程主要包括四部分:語音識別、意圖理解、對話管理、自然語言生成;其中,意圖理解將用戶輸入的非結構化請求文本轉換為結構化的語義表示,對話管理根據意圖理解的結果和上下文語境等因素調用服務;由此可知,基于意圖理解的服務調用是任務型對話系統的核心。
意圖理解輸出的結構化語義表示包括三部分:域、意圖、槽;其中,域(domain)是用戶請求的范圍,意圖(intent)是用戶請求的類型,槽(slot)是刻畫用戶請求的實體。例如,在請求“訂一張上海飛北京的頭等艙,下午五點出發”中,域是“訂票”、意圖是“飛機”、槽是“出發地=上海、目的地=北京、時間=下午五點”。
域、意圖和槽構成結構化語義的層次結構。其中,每種意圖都有對應的服務程序,將“槽”中的實體轉換為參數,調用服務程序即可處理用戶請求。
除了切換系統外,“域”在同一個系統中通常不發生變化,所以意圖理解的主要工作是意圖分類和實體識別。常用方法包括下述3種:
(1)基于規則的方法
使用關鍵詞/正則表達式匹配來判定意圖類型,同時抽取實體。這種方法靈活、簡單,不需要訓練數據;但需要大量的規則,隨著規則的增加,維度難度也隨之上升。
(2)基于傳統機器學習的方法
首先,在語料中標注出實體和意圖類型;然后,根據實體標注結果,通過HMM、CRF等方法訓練出實體識別器;隨后,根據語料特征和意圖類型,通過SVM、LR等傳統機器學習方法生成意圖分類器。該方法源于數據驅動,具有一定的泛化能力。但是該方法需要大量精確標注的語料,對于給定類型的意圖而言,用戶提問的方式有限,語料數量很少;任務型對話系統中的語料都是短文本,可供訓練的特征不多;上述兩方面影響了該方法的準確性。此外,傳統機器學習程序具有“黑箱”特性,內部運行機理復雜、參數不易調整、結果可解釋性較差。
(3)基于深度學習的方法
需要綜合CNN、LSTM、CRF等多種方法,主要包括兩部分內容,如下:
A、構建意圖分類器:首先,通過詞匯向量化,將語料轉換為向量;然后,將意圖分類視為短文本分類,使用CNN訓練向量化后的語料,生成意圖分類模型。
B、構建命名實體識別器:首先,通過數據預處理(分句、分詞)工具處理輸入語句,得到詞匯特征向量;然后,使用CNN處理每個單詞的字符,得到對應的字符特征向量;隨后,組合詞匯特征向量和字符特征向量,傳入雙向LSTM網絡進行訓練,得到輸入語句的信息特征;最后,將雙向LSTM輸出的語句信息特征作為CRF層的輸入,使用CRF模型進行訓練,得到命名實體識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810569449.8/2.html,轉載請聲明來源鉆瓜專利網。





