[發明專利]基于深度學習模型的處警警情類別確定方法和裝置在審
| 申請號: | 202010307543.3 | 申請日: | 2020-04-17 |
| 公開(公告)號: | CN113111171A | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 彭濤 | 申請(專利權)人: | 北京明億科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06F40/289;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 北京植德律師事務所 11780 | 代理人: | 唐華東 |
| 地址: | 100021 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 模型 處警警情 類別 確定 方法 裝置 | ||
本公開實施例公開了基于深度學習模型的處警警情類別確定方法和裝置。該方法的一具體實施方式包括:將待分類處警文本進行切詞得到相應的分詞序列;基于所得到的分詞序列確定待分類處警文本的文本特征向量;對于預設處警警情類別集合中的每個處警警情類別,將文本特征向量輸入與該處警警情類別對應的分類模型,得到用于指示待分類處警文本是否屬于該處警警情類別的分類結果,其中,與各處警警情類別對應的分類模型是基于深度學習模型訓練得到的;用預設處警警情類別集合中的各目標處警警情類別生成待分類處警文本對應的處警警情類別集合,其中,分類結果指示待分類處警文本屬于目標處警警情類別。該實施方式實現了自動對處警文本進行處警警情分類。
技術領域
本公開實施例涉及計算機技術領域,具體涉及基于深度學習模型的處警警情類別確定方法和裝置。
背景技術
目前,公安機關的處警員在處警結束后會根據處警過程整理相應的處警文本,并人工給出該處警文本所記載警情的警情分類。后續,根據所給出的警情分類可以確定由相應的案情分析人員對不同處警警情分類的處警文本進行統計分析處理。因此,對處警文本進行警情分類在接處警過程中是非常重要的。
發明內容
本公開實施例提出了基于深度學習模型的處警警情類別確定方法和裝置。
第一方面,本公開實施例提供了一種基于深度學習模型的處警警情類別確定方法,該方法包括:將待分類處警文本進行切詞得到相應的分詞序列;基于所得到的分詞序列確定待分類處警文本的文本特征向量;對于預設處警警情類別集合中的每個處警警情類別,將文本特征向量輸入與該處警警情類別對應的分類模型,得到用于指示待分類處警文本是否屬于該處警警情類別的分類結果,其中,與各處警警情類別對應的分類模型是基于深度學習模型訓練得到的;用預設處警警情類別集合中的各目標處警警情類別生成待分類處警文本對應的處警警情類別集合,其中,分類結果指示待分類處警文本屬于目標處警警情類別。
在一些實施例中,預設處警警情類別集合中每個處警警情類別對應的分類模型是通過如下訓練步驟預先訓練得到的:獲取訓練樣本集合,訓練樣本包括歷史處警文本和對應的標注警情類別集合;對于預設處警警情類別集合中的每個處警警情類別,執行以下分類模型訓練操作:將訓練樣本集合中對應的標注警情類別集合包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的正樣本集合;將訓練樣本集合中對應的標注警情類別集合不包括該處警警情類別的各訓練樣本中的歷史處警文本對應的文本特征向量確定為該處警警情類別對應的負樣本集合;基于該處警警情類別對應的正樣本集合和負樣本集合訓練該處警警情類別對應的基于深度學習模型的分類模型。
在一些實施例中,基于所得到的分詞序列確定待分類處警文本的文本特征向量,包括:對于分詞序列中的每個分詞,計算該分詞的詞頻-逆文本頻率指數TF-IDF,以及將待分類處警文本的文本特征向量中與該分詞對應的分量設置為計算得到的該分詞的TF-IDF,其中,待分類處警文本的文本特征向量中的各分量分別與預設詞典中的各詞語一一對應;將待分類處警文本的文本特征向量中的各未賦值分量設置為預設數值,未賦值分量為屬于預設詞典但不屬于分詞序列的詞語對應的分量。
在一些實施例中,預設處警警情類別集合包括以下至少一項:電信詐騙類別、金融詐騙類別、保險詐騙類別。
第二方面,本公開實施例提供了一種基于深度學習模型的處警警情類別確定裝置,該裝置包括:切詞單元,被配置成將待分類處警文本進行切詞得到相應的分詞序列;特征確定單元,被配置成基于所得到的分詞序列確定待分類處警文本的文本特征向量;分類單元,被配置成對于預設處警警情類別集合中的每個處警警情類別,將文本特征向量輸入與該處警警情類別對應的分類模型,得到用于指示待分類處警文本是否屬于該處警警情類別的分類結果,其中,與各處警警情類別對應的分類模型是基于深度學習模型訓練得到的;生成單元,被配置成用預設處警警情類別集合中的各目標處警警情類別生成待分類處警文本對應的處警警情類別集合,其中,分類結果指示待分類處警文本屬于目標處警警情類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明億科技有限公司,未經北京明億科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010307543.3/2.html,轉載請聲明來源鉆瓜專利網。





