[發明專利]一種用戶意圖的語料擴展方法和系統有效
| 申請號: | 202010440488.5 | 申請日: | 2020-05-22 |
| 公開(公告)號: | CN111339309B | 公開(公告)日: | 2020-09-04 |
| 發明(設計)人: | 金春祥;劉佳;崔恒斌 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F16/332 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 意圖 語料 擴展 方法 系統 | ||
本說明書的實施例公開了一種用戶意圖的語料擴展方法,該方法包括:獲取第一服務話術和用戶意圖,所述用戶意圖為回答所述第一服務話術的話語所代表的意圖;從至少一條第二服務話術中,確定與所述第一服務話術的相似度滿足第一預設條件的至少一條第三服務話術,所述第二服務話術為對話記錄中的服務話術;確定至少一條候選擴展語料,所述候選擴展語料為所述對話記錄中回答所述至少一條第三服務話術的話語;從所述至少一條候選擴展語料中,確定至少一條目標擴展語料,所述目標擴展語料的意圖與所述用戶意圖相同或者相近;將所述至少一條目標擴展語料作為所述用戶意圖的擴展語料。
技術領域
本申請涉及數據處理領域,特別涉及一種用戶意圖的語料擴展方法和系統。
背景技術
隨著人工智能的發展,機器可以通過對人類語言進行分析,識別語句的含義,實現人機交互。問答為人機交互的一種典型應用場景,機器需要識別出提用戶說的話的意圖,才能準確的給出后續的對話。
用戶意圖可以通過建立自然語言模型來預測。然而,模型的建立需要大量的訓練語料,在訓練模型的語料數量有限的情況下,需要挖掘更多的用戶語料,做數據增強,提升模型對用戶意圖的識別效果。因此,亟需一種用戶意圖的語料擴展方法和系統。
發明內容
本說明書一個方面提供一種用戶意圖的語料擴展方法,所述方法包括:獲取第一服務話術和用戶意圖,所述用戶意圖為回答所述第一服務話術的話語所代表的意圖;從至少一條第二服務話術中,確定與所述第一服務話術的相似度滿足第一預設條件的至少一條第三服務話術,所述第二服務話術為對話記錄中的服務話術;確定至少一條候選擴展語料,所述候選擴展語料為所述對話記錄中回答所述至少一條第三服務話術的話語;從所述至少一條候選擴展語料中,確定至少一條目標擴展語料,所述目標擴展語料的意圖與所述用戶意圖相同或者相近;將所述至少一條目標擴展語料作為所述用戶意圖的擴展語料。
本說明書另一個方面提供一種用戶意圖的語料擴展系統,所述系統包括:第一獲取模塊,用于獲取第一服務話術和用戶意圖,所述用戶意圖為回答所述第一服務話術的話語所代表的意圖;第一確定模塊,用于從至少一條第二服務話術中,確定與所述第一服務話術的相似度滿足第一預設條件的至少一條第三服務話術,所述第二服務話術為對話記錄中的服務話術;第二確定模塊,用于確定至少一條候選擴展語料,所述候選擴展語料為所述對話記錄中回答所述至少一條第三服務話術的話語;第三確定模塊,用于從所述至少一條候選擴展語料中,確定至少一條目標擴展語料,所述目標擴展語料的意圖與所述用戶意圖相同或者相近;將所述至少一條目標擴展語料作為所述用戶意圖的擴展語料。
本說明書另一個方面提供一種用戶意圖的語料擴展裝置,包括至少一個存儲介質和至少一個處理器;所述至少一個存儲介質用于存儲計算機指令;所述至少一個處理器用于執行所述計算機指令以實現用戶意圖的語料擴展方法。
附圖說明
本說明書將以示例性實施例的方式進一步說明,這些示例性實施例將通過附圖進行詳細描述。這些實施例并非限制性的,在這些實施例中,相同的編號表示相同的結構,其中:
圖1是根據本說明書一些實施例所示的用戶意圖的語料擴展系統的示例性應用場景示意圖;
圖2是根據本說明書一些實施例所示的用戶意圖的語料擴展方法的示例性示意圖;
圖3是根據本說明書一些實施例所示的確定第三服務話術方法的示例性示意圖;
圖4是根據本說明書一些實施例所示的確定目標擴展語料的示例性示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010440488.5/2.html,轉載請聲明來源鉆瓜專利網。





