[發明專利]一種多模態融合敏感信息分類檢測方法有效
| 申請號: | 202110203458.7 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN113033610B | 公開(公告)日: | 2022-09-13 |
| 發明(設計)人: | 張志勇;宋斌;張藍方;梁騰翔;徐艷艷;苗坤霖;趙長偉;黃帥娜;李靜;張孝國 | 申請(專利權)人: | 河南科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/764;G06V10/80;G06F16/35;G06F16/55;G06F40/216;G06N20/00 |
| 代理公司: | 洛陽公信知識產權事務所(普通合伙) 41120 | 代理人: | 宋晨煒 |
| 地址: | 471000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多模態 融合 敏感 信息 分類 檢測 方法 | ||
1.一種多模態融合敏感信息分類檢測方法,其特征在于:包括以下步驟:
步驟1、對文本和圖片進行敏感性初級檢測
采用FastText檢測文本的敏感性,判斷文本屬于敏感類中的哪一個敏感分類或非敏感類,并得到文字的分類概率集合,記為:采用InceptionV3網絡來檢測圖片的敏感性,判斷圖片屬于敏感類中的哪一個敏感分類或非敏感類,并得到圖片的分類概率集合,記為:其中,n代表圖片或文本的分類個數,圖片和文本的分類個數相等;若文本屬于敏感類,則執行步驟2,若文本屬于非敏感分類,則執行步驟3;
步驟2、基于情感對文本敏感性進行判定
步驟2.1、采用jieba分詞將文本分割為多個詞語,并通過與已有的情感詞庫和敏感詞庫進行匹配,得到情感詞集合和敏感詞集合,并對兩個集合進行笛卡爾乘積運算,判斷情感情和敏感詞是否共現,情感詞具有包括情感極性和情感強度的情感極性強度;
步驟2.2、用情感詞的情感極性強度和敏感詞結合來判定文本的敏感性,其計算方法為:
AllSensitiveCount=PositiveSensitiveCount-NegativeSensitiveCount (4)
其中,PositiveSensitiveCou nt表示敏感詞的正向情感分數,NegativeSensitiveCount表示敏感詞的負向情感分數,AllSensitiveCount表示敏感詞總體情感分數,為敏感詞與正向情感詞共現的次數,為敏感詞與負向情感詞共現的次數,n為jieba分詞后的總詞個數,λ為情感詞的正向情感強度,β為情感詞的負向情感強度;
步驟2.3、若總體情感分數AllSensitiveCount>0直接將文本判定為原敏感分類,敏感分類概率組成的概率集合仍記為:AllSensitiveCount≤0時,需要進行二次判斷,計算敏感詞出現的詞頻,當詞頻大于設定的閾值時,也直接判定為原敏感分類,敏感分類概率組成的概率集合仍記為:反之,將文本判定為其他敏感分類,敏感分類概率組成的概率集合記為:Pg=[0,0,...,0,1];
步驟3、圖文融合的多模態敏感性檢測
將文本的敏感分類概率與圖片的敏感分類概率通過融合算法得到敏感類型概率Pi,通過MAX(Pi)取最大敏感類型概率P,將最大敏感類型概率P對應的敏感分類,作為最終的敏感分類結果。
2.如權利要求1所述的一種多模態融合敏感信息分類檢測方法,其特征在于:最終的敏感分類概率P分配計算公式如下:
P=MAX(Pi) (6)
其中,w為融合權重,取值范圍為[0,1],Pi為敏感類型概率分布。
3.如權利要求1所述的一種多模態融合敏感信息分類檢測方法,其特征在于:判斷情感詞和敏感詞是否共現的方法為,根據最近距離原則,取情感詞與敏感詞所在句中的最小距離作為兩者的共現。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南科技大學,未經河南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110203458.7/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





