[發(fā)明專利]對話文本分析方法、裝置、電子裝置及存儲介質在審
| 申請?zhí)枺?/td> | 202011254446.9 | 申請日: | 2020-11-11 |
| 公開(公告)號: | CN112364622A | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設計)人: | 謝恩寧;陳糧陽 | 申請(專利權)人: | 杭州大搜車汽車服務有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/295;G06F40/35;G06N3/00 |
| 代理公司: | 杭州華進聯浙知識產權代理有限公司 33250 | 代理人: | 聶磊 |
| 地址: | 311100 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話 文本 分析 方法 裝置 電子 存儲 介質 | ||
本申請涉及一種對話文本分析方法、裝置、電子裝置和存儲介質。該對話文本分析方法包括:獲取待分析的對話文本數據,其中,對話文本數據包括多輪次對話文本分析所產生的文本數據及與多輪次對話文本分析關聯的實時通信數據;根據預設語義匹配規(guī)則對文本數據進行語義匹配,確定候選意向標簽數據;對候選意向標簽數據進行篩選處理,獲取目標意向標簽數據;根據實時通信數據確定目標意向標簽數據對應的意向等級。通過本申請,解決了相關技術中文本分析系統誤匹配率高、運營成本高的問題,實現了高效且便捷地提取對話文本中與業(yè)務目標強相關的真實客戶意向標簽,并結合對話相關指標將客戶劃分成不同的意向等級的有益效果。
技術領域
本申請涉及計算機技術領域,特別是涉及對話文本分析方法、裝置、電子裝置及存儲介質。
背景技術
近幾年,人工智能技術得到迅速地發(fā)展,與智能語音技術相關的產品已經進入到千家萬戶中。人們逐漸習慣了與機器對話,并且對機器的理解與應答能力有了更高的期待。基于語音的對話系統框架采用自動語音識別(ASR,Automatic Speech Recognition)模型和自然語言理解(NLU,Natural Language Understanding)模型,工作流程包括:首先通過ASR模型將用戶的聲音轉換為文字,然后利用NLU模型進行語義解析,識別文本意圖,最終實現對話文本分析交互。
相關技術中的對話機器人文本分析,常采用關鍵詞匹配、客戶意圖分類。其中,使用關鍵詞匹配的文本分析系統,缺點是誤匹配率高,同時,語音機器人的文本對話數據往往是通過自動語音識別(ASR)轉化而來,存在一定量級的字詞錯誤率;使用客戶意圖分類的文本分析系統,缺點是需要大量業(yè)務場景相關的標注數據,人力成本極高,并且不支持業(yè)務所需進行快速修改;對于新的業(yè)務場景構建期間業(yè)務頻繁對客戶意向標簽進行修改不友好,并且不支持場景遷移。
目前針對相關技術中文本分析系統誤匹配率高、運營成本高的問題,尚未提出有效的解決方案。
發(fā)明內容
本申請實施例提供了一種對話文本分析方法、裝置、電子裝置及存儲介質,以至少解決相關技術中文本分析系統誤匹配率高、運營成本高的問題。
第一方面,本申請實施例提供了一種對話文本分析方法,包括:獲取待分析的對話文本數據,其中,所述對話文本數據包括多輪次對話文本分析所產生的文本數據及與所述多輪次對話文本分析關聯的實時通信數據;根據預設語義匹配規(guī)則對所述文本數據進行語義匹配,確定候選意向標簽數據,其中,所述預設語義匹配規(guī)則基于預設語義匹配模型和預設配置信息確定,所述預設配置信息包括對不同對話文本分析所產生的文本數據進行解析的解析信息;對所述候選意向標簽數據進行篩選處理,獲取目標意向標簽數據,其中,所述篩選處理包括實體抽取、標簽過濾;根據所述實時通信數據確定所述目標意向標簽數據對應的意向等級。
在其中一些實施例中,根據預設語義匹配規(guī)則對所述對話文本數據進行語義匹配,確定候選意向標簽數據包括:對所述文本數據進行自然語言理解,得到與所述多輪次對話文本分析對應的第一語義數據;獲取所述第一語義數據中用戶對話所對應的第一用戶語義數據;通過所述預設語義匹配模型在所述第一用戶語義數據中檢測至少一個第一目標語義數據,其中,所述第一目標語義數據包括所述預設配置信息中與用戶意圖數據關聯的用戶潛在意圖數據,所述預設語義匹配模型包括BERT語義匹配模型;在檢測到所述第一目標語義數據的情況下,確定所述候選意向標簽數據包括所述第一目標語義數據。
在其中一些實施例中,在未檢測到所述第一目標語義數據的情況下,所述方法包括:獲取第一輪次對話中的第一機器人話術,其中,所述第一輪次對話包括所述多輪次對話文本分析其中一次;對與所述第一機器人話術對應的第一用戶應答數據進行推理,得到第一推理意圖數據,并確定所述候選意向標簽數據包括所述第一推理意圖數據,其中,所述第一推理意圖數據包括所述第一用戶應答數據關聯的語義特征值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州大搜車汽車服務有限公司,未經杭州大搜車汽車服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011254446.9/2.html,轉載請聲明來源鉆瓜專利網。





