[發明專利]基于AI訓練的詞匯過濾方法及系統有效
| 申請號: | 202111285459.7 | 申請日: | 2021-11-02 |
| 公開(公告)號: | CN113722468B | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 陳芳芳 | 申請(專利權)人: | 杭銀消費金融股份有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F40/216;G06F40/30 |
| 代理公司: | 浙江維創盈嘉專利代理有限公司 33477 | 代理人: | 龔洋洋 |
| 地址: | 310005 浙江省杭州市下城區慶春路38號1層101*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 ai 訓練 詞匯 過濾 方法 系統 | ||
1.一種基于AI訓練的詞匯過濾方法,其特征在于,應用于詞匯過濾系統,所述方法包括:
依據對第一待處理文本會話事件提取的會話段落集,確定所述會話段落集中熱點詞匯的使用分布情況;通過所述會話段落集中熱點詞匯的使用分布情況,確定在設定統計階段內添加到所述第一待處理文本會話事件的第一熱頻詞匯總結果和與所述第一待處理文本會話事件存在上下游關系的第二熱頻詞匯總結果;通過所述第一熱頻詞匯總結果和所述第二熱頻詞匯總結果,建立針對第二待處理文本會話事件下待分析語句的AI過濾策略;其中,所述第二待處理文本會話事件為以下至少一項:與所述第一待處理文本會話事件一致;與所述第一待處理文本會話事件存在綁定關系的衍生文本會話事件;
其中,所述第一待處理文本會話事件包括設定會話場景內的第一交互主題,所述通過所述第一熱頻詞匯總結果和所述第二熱頻詞匯總結果,建立針對第二待處理文本會話事件下待分析語句的AI過濾策略,包括:通過所述第一熱頻詞匯總結果和所述第二熱頻詞匯總結果,確定所述第一交互主題在所述設定統計階段內的訪問統計結果;
通過所述第一交互主題在所述設定統計階段內的訪問統計結果,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略;
其中,當所述第一交互主題包括兩個或多于兩個時,所述通過所述第一交互主題在所述設定統計階段內的訪問統計結果,建立針對第二待處理文本會話事件下待分析語句的AI過濾策略,包括:通過所述第一交互主題中每個交互主題在相同匯總計劃下匹配的訪問統計結果,以及所述每個交互主題在所述相同匯總計劃下需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略;
其中,所述通過所述第一交互主題中每個交互主題在相同匯總計劃下匹配的訪問統計結果,以及所述每個交互主題在所述相同匯總計劃下需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略,包括:通過所述每個交互主題在相同匯總計劃下匹配的訪問統計結果,從所述第一交互主題中確定第一目標交互主題和第二目標交互主題,所述第一目標交互主題為所述第一交互主題中最小訪問統計結果匹配的交互主題,所述第二目標交互主題為所述第一交互主題中最大訪問統計結果匹配的交互主題;將所述第一目標交互主題作為所述第二待處理文本會話事件,通過所述第二目標交互主題內需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的分治化過濾策略;
當所述第一交互主題為一個時,所述通過所述第一交互主題在所述設定統計階段內的訪問統計結果,建立針對第二待處理文本會話事件下待分析語句的AI過濾策略,包括:通過所述第一交互主題在不同匯總計劃下分別匹配的訪問統計結果,以及所述第一交互主題在不同匯總計劃下分別需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略;
其中,所述通過所述第一交互主題在不同匯總計劃下分別匹配的訪問統計結果,以及所述第一交互主題在不同匯總計劃下分別需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略,包括:在所述第一交互主題在不同匯總計劃集內分別需要進行詞匯過濾分析的語句一致的前提下,通過所述第一交互主題在不同匯總計劃下分別匹配的訪問統計結果,確定所述第一交互主題需要進行詞匯過濾分析的語句匹配的目標詞匯過濾條件;所述目標詞匯過濾條件匹配的訪問統計結果不小于設定訪問統計結果判定值;
通過所述目標詞匯過濾條件,建立在所述目標詞匯過濾條件針對所述第二待處理文本會話事件下待分析語句的AI過濾策略;
其中,所述通過所述第一交互主題在不同匯總計劃下分別匹配的訪問統計結果,以及所述第一交互主題在不同匯總計劃下分別需要進行詞匯過濾分析的語句,建立針對所述第二待處理文本會話事件下待分析語句的AI過濾策略,包括:在所述第一交互主題在不同匯總計劃集內分別需要進行詞匯過濾分析的語句不一致的前提下,通過所述第一交互主題在不同匯總計劃下分別匹配的訪問統計結果,確定所述第一交互主題在不同匯總計劃需要進行詞匯過濾分析的語句與對應詞匯過濾條件之間的相關性系數;基于確定的所述相關性系數,建立在衍生詞匯過濾條件針對所述第二待處理文本會話事件下待分析語句的AI過濾策略;
其中,所述通過所述第一熱頻詞匯總結果和所述第二熱頻詞匯總結果,確定第一交互主題在所述設定統計階段內的訪問統計結果,包括:通過所述第一熱頻詞匯總結果和所述第二熱頻詞匯總結果,得到全局頻詞匯總結果;將所述第一熱頻詞匯總結果和所述全局頻詞匯總結果的量化分析結果,作為所述第一交互主題在所述設定統計階段內的訪問統計結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭銀消費金融股份有限公司,未經杭銀消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111285459.7/1.html,轉載請聲明來源鉆瓜專利網。





