[發明專利]基于深度學習模型的處警警情類別確定方法和裝置在審
| 申請號: | 202010307543.3 | 申請日: | 2020-04-17 |
| 公開(公告)號: | CN113111171A | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 彭濤 | 申請(專利權)人: | 北京明億科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06F40/289;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 北京植德律師事務所 11780 | 代理人: | 唐華東 |
| 地址: | 100021 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 模型 處警警情 類別 確定 方法 裝置 | ||
1.一種基于深度學習模型的處警警情類別確定方法,包括:
將待分類處警文本進行切詞得到相應的分詞序列;
基于所得到的分詞序列確定所述待分類處警文本的文本特征向量;
對于預設處警警情類別集合中的每個處警警情類別,將所述文本特征向量輸入與該處警警情類別對應的分類模型,得到用于指示所述待分類處警文本是否屬于該處警警情類別的分類結果,其中,與各所述處警警情類別對應的分類模型是基于深度學習模型訓練得到的;
用所述預設處警警情類別集合中的各目標處警警情類別生成所述待分類處警文本對應的處警警情類別集合,其中,分類結果指示所述待分類處警文本屬于目標處警警情類別。
2.根據權利要求1所述的方法,其中,所述預設處警警情類別集合中每個處警警情類別對應的分類模型是通過如下訓練步驟預先訓練得到的:
獲取訓練樣本集合,訓練樣本包括歷史處警文本和對應的標注警情類別集合;
對于所述預設處警警情類別集合中的每個處警警情類別,執行以下分類模型訓練操作:將所述訓練樣本集合中對應的標注警情類別集合包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的正樣本集合;將所述訓練樣本集合中對應的標注警情類別集合不包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的負樣本集合;基于該處警警情類別對應的正樣本集合和負樣本集合訓練該處警警情類別對應的基于深度學習模型的分類模型。
3.根據權利要求2所述的方法,其中,所述基于所得到的分詞序列確定所述待分類處警文本的文本特征向量,包括:
對于所述分詞序列中的每個分詞,計算該分詞的詞頻-逆文本頻率指數TF-IDF,以及將所述待分類處警文本的文本特征向量中與該分詞對應的分量設置為計算得到的該分詞的TF-IDF,其中,所述待分類處警文本的文本特征向量中的各分量分別與預設詞典中的各詞語一一對應;
將所述待分類處警文本的文本特征向量中的各未賦值分量設置為預設數值,未賦值分量為屬于所述預設詞典但不屬于所述分詞序列的詞語對應的分量。
4.根據權利要求1-3中任一所述的方法,其中,所述預設處警警情類別集合包括以下至少一項:電信詐騙類別、金融詐騙類別、保險詐騙類別。
5.一種基于深度學習模型的處警警情類別確定裝置,包括:
切詞單元,被配置成將待分類處警文本進行切詞得到相應的分詞序列;
特征確定單元,被配置成基于所得到的分詞序列確定所述待分類處警文本的文本特征向量;
分類單元,被配置成對于預設處警警情類別集合中的每個處警警情類別,將所述文本特征向量輸入與該處警警情類別對應的分類模型,得到用于指示所述待分類處警文本是否屬于該處警警情類別的分類結果,其中,與各所述處警警情類別對應的分類模型是基于深度學習模型訓練得到的;
生成單元,被配置成用所述預設處警警情類別集合中的各目標處警警情類別生成所述待分類處警文本對應的處警警情類別集合,其中,分類結果指示所述待分類處警文本屬于目標處警警情類別。
6.根據權利要求5所述的裝置,其中,所述預設處警警情類別集合中每個處警警情類別對應的分類模型是通過如下訓練步驟預先訓練得到的:
獲取訓練樣本集合,訓練樣本包括歷史處警文本和對應的標注警情類別集合;
對于所述預設處警警情類別集合中的每個處警警情類別,執行以下分類模型訓練操作:將所述訓練樣本集合中對應的標注警情類別集合包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的正樣本集合;將所述訓練樣本集合中對應的標注警情類別集合不包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的負樣本集合;基于該處警警情類別對應的正樣本集合和負樣本集合訓練該處警警情類別對應的基于深度學習模型的分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明億科技有限公司,未經北京明億科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010307543.3/1.html,轉載請聲明來源鉆瓜專利網。





