[發明專利]一種構造ASR/NLU引擎交叉優化數據閉環的方法及裝置有效
| 申請號: | 201910983952.2 | 申請日: | 2019-10-16 |
| 公開(公告)號: | CN110781279B | 公開(公告)日: | 2022-04-01 |
| 發明(設計)人: | 滕義偉 | 申請(專利權)人: | 云知聲智能科技股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G10L15/01;G10L15/26 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 張楠楠 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構造 asr nlu 引擎 交叉 優化 數據 閉環 方法 裝置 | ||
1.一種構造ASR/NLU引擎交叉優化數據閉環的方法,其特征在于,包括:
步驟S1:基于預先存儲的日志數據庫,抽取與用戶語音交互相關的異常日志,并復原與所述異常日志相關的用戶交互流程,形成交叉驗證日志;
步驟S2:發送所述交叉驗證日志中的待識別語音日志到ASR引擎,獲取到相關的待識別文本日志,并將所獲取的所述待識別文本日志發送到NLU引擎,獲取到與所述待識別文本日志相關的驗證意圖日志,實現引擎交叉驗證;
步驟S3:將所述步驟S2中所獲取的待識別文本日志與所述交叉驗證日志中的待比較文本日志、及所述步驟S2中所獲取的驗證意圖日志與所述交叉驗證日志中的待比較意圖日志進行分類比較,并獲得引擎問題分類結果;所述引擎問題分類結果,是待識別文本日志與待比較文本日志、及驗證意圖日志與待比較意圖日志之間的比較結果;
步驟S4:根據所述步驟S3所獲得的引擎問題分類結果,推送相關的異常用戶交互類別到對應的設備終端進行顯示,同時根據所述異常用戶交互類別構建相應的異常測試集。
2.如權利要求1所述的方法,其特征在于,所述步驟S1中,所述預先存儲的日志數據庫中的日志數據的獲取步驟包括:
步驟S11:實時采集所述用戶語音交互中所產生的語音日志、文本日志和意圖日志;
步驟S12:構建所采集的所述語音日志、文本日志和意圖日志之間的關聯性;
步驟S13:將所述步驟S11中所采集的語音日志、文本日志和意圖日志、及所述步驟S12中所構建的關聯性存儲到所述日志數據庫中,實現對日志數據的獲取;
其中,所述日志數據包括:用戶語音交互中所產生的語音日志、文本日志、意圖日志、及所構建的所述語音日志、文本日志和意圖日志之間的關聯性。
3.如權利要求2所述的方法,其特征在于,所述步驟S1中,復原與所述異常日志相關的用戶交互流程,形成交叉驗證日志,是基于所述日志數據庫中所存儲的所構建的所述語音日志、文本日志和意圖日志之間的關聯性實現的。
4.如權利要求1所述的方法,其特征在于,所述異常日志包括:
ASR引擎請求中非正常響應的日志,和/或
NLU無法理解用戶意圖的日志。
5.如權利要求1所述的方法,其特征在于,所述引擎問題分類結果包括:
當所述待識別文本日志與所述待比較文本日志一致,且所述驗證意圖日志與所述待比較意圖日志一致時,為第一引擎問題分類結果;
當所述待識別文本日志與所述待比較文本日志一致,且所述驗證意圖日志與所述待比較意圖日志不一致時,為第二引擎問題分類結果;
當所述待識別文本日志與所述待比較文本日志不一致,且所述驗證意圖日志與所述待比較意圖日志一致時,為第三引擎問題分類結果;
當所述待識別文本日志與所述待比較文本日志不一致,且所述驗證意圖日志與所述待比較意圖日志不一致時,為第四引擎問題分類結果;
根據不同的引擎問題分類結果,執行不同的報警操作。
6.一種構造ASR/NLU引擎交叉優化數據閉環的裝置,其特征在于,包括:
復原模塊,用于基于預先存儲的日志數據庫,抽取與用戶語音交互相關的異常日志,并復原與所述異常日志相關的用戶交互流程,形成交叉驗證日志;
發送模塊,用于發送所述復原模塊所形成的所述交叉驗證日志中的待識別語音日志到ASR引擎,獲取到相關的待識別文本日志,并將所獲取的所述待識別文本日志發送到NLU引擎,獲取到與所述待識別文本日志相關的驗證意圖日志,實現引擎交叉驗證;
比較模塊,用于將所述發送模塊所獲取的待識別文本日志與所述交叉驗證日志中的待比較文本日志、及所獲取的驗證意圖日志與所述交叉驗證日志中的待比較意圖日志進行分類比較,并獲得引擎問題分類結果;所述引擎問題分類結果,是待識別文本日志與待比較文本日志、及驗證意圖日志與待比較意圖日志之間的比較結果;
第一構建模塊,用于根據所述比較模塊所獲得的引擎問題分類結果,推送相關的異常用戶交互類別到對應的設備終端進行顯示,同時根據所述異常用戶交互類別構建相應的異常測試集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司,未經云知聲智能科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910983952.2/1.html,轉載請聲明來源鉆瓜專利網。





