[發明專利]對話識別方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202111372165.8 | 申請日: | 2021-11-18 |
| 公開(公告)號: | CN114091476A | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 王珍珠;張建 | 申請(專利權)人: | 北京淘友天下科技發展有限公司 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話 識別 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
1.一種對話識別方法,其特征在于,所述方法包括:
響應于選中目標聊天對話的操作,展示對話識別控件;
響應于觸發所述對話識別控件,展示所述目標聊天對話經對話識別后的識別結果;
其中,所述識別結果用于指示所述目標聊天對話是否包括詐騙信息。
2.根據權利要求1所述的對話識別方法,其特征在于,響應于觸發所述對話識別控件,展示所述目標聊天對話經對話識別后的識別結果,包括:
將所述目標聊天對話的文本內容輸入預先訓練的對話識別模型中,獲得所述對話識別模型輸出的所述文本內容中包括詐騙信息的概率;
若確定所述概率大于或等于預設閾值,則確定所述識別結果為所述目標聊天對話包括詐騙信息;
其中,所述對話識別模型是以預先獲取到的樣本聊天對話的文本內容為訓練樣本,以所述樣本聊天對話的文本內容中是否包括詐騙信息為訓練標簽訓練而成。
3.根據權利要求2所述的對話識別方法,其特征在于,所述對話識別模型的訓練過程包括:
獲取所述訓練樣本和訓練標簽,所述訓練樣本包括第一文本和第二文本;所述第一文本包括詐騙信息;所述第二文本不包括詐騙信息;所述訓練標簽用于表征相應的訓練樣本是否包括詐騙信息;
以所述訓練樣本和所述訓練標簽對初始神經網絡模型訓練,以獲得所述對話識別模型。
4.根據權利要求2所述對話識別方法,其特征在于,所述將所述目標聊天對話的文本內容輸入預先訓練的對話識別模型中,之前還包括:
將所述目標聊天對話的文本內容中的每一條對話文本按照所述每一條對話文本產生的時間順序排列;
若確定所述任意相鄰的兩句對話文本為同一對話對象產生的,則使用第一預設字符拼接所述相鄰的兩條對話文本,獲得拼接后的文本內容,和/或,若確定所述相鄰的兩條對話文本為不同對話對象產生的,則使用第二預設字符拼接所述相鄰的兩條對話文本,獲得拼接后的文本內容。
5.根據權利要求3所述的對話識別方法,其特征在于,所述初始神經網絡為基于Transformer的雙向語言表征模型BERT模型。
6.根據權利要求3所述的對話識別方法,其特征在于,所述獲得所述對話識別模型,之后還包括:
根據所述對話識別模型,結合預設的Flask應用框架,搭建web服務;
所述web服務被調用時用于根據所述對話識別模型識別所述目標聊天對話。
7.根據權利要求2所述的對話識別方法,其特征在于,所述確定所述識別結果為所述目標聊天對話包括詐騙信息,之后還包括:
屏蔽具有詐騙信息的目標聊天對話的發起者。
8.一種對話識別裝置,其特征在于,所述裝置包括:
第一響應模塊,用于響應于選中目標聊天對話的操作,展示對話識別控件;
第二響應模塊,用于響應于觸發所述對話識別控件,展示所述目標聊天對話經對話識別后的識別結果;
其中,所述識別結果用于指示所述目標聊天對話是否包括詐騙信息。
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于,所述處理器執行所述計算機程序以實現權利要求1-5任一項所述的對話識別方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-5任一項所述的對話識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淘友天下科技發展有限公司,未經北京淘友天下科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111372165.8/1.html,轉載請聲明來源鉆瓜專利網。





