[發明專利]數據庫分級分類方法、系統、裝置及存儲介質有效
| 申請號: | 202210734483.2 | 申請日: | 2022-06-27 |
| 公開(公告)號: | CN115168345B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 袁征 | 申請(專利權)人: | 天翼愛音樂文化科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/245;G06F16/248 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 鄭宏謀 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 分級 分類 方法 系統 裝置 存儲 介質 | ||
本發明公開了一種數據庫分級分類方法、系統、裝置及存儲介質,首先對數據庫中數據屬性字段對應的數據進行抽取,獲得字段信息;根據數據屬性字段和字段信息,構建數據庫綜合信息體;對數據庫綜合信息體內的字段信息進行數據識別,獲得字段信息對應的識別標簽;根據識別標簽和預設的分級分類關聯樹,確定字段信息對應的分級分類結果;對分級分類結果進行展示。本申請實施例在對數據庫進行分級分類時,考慮到數據庫數據的屬性信息,在數據庫剛上線沒有數據值等情況下,能夠對數據庫中的數據進行有效的分級分類。本方案中抽取部分數據進行數據識別,能夠有效解決相關數據中識別海量數據的耗時較長的問題。
技術領域
本申請涉及數據庫技術領域,尤其涉及一種數據庫分級分類方法、系統、裝置及存儲介質。
背景技術
隨著大數據技術的發展,越來越多的數據被收集起來用于進行大數據分析。為了存儲在數據庫中的海量數據進行篩選,相關技術主要通過字典、正則匹配、人工標識的方式針對數據庫中存儲的數據值進行分類分級識別,但是相關技術的方案的準確度和效率都比較底下,難以匹配當前數據量極速增長的現狀。
發明內容
本申請旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本申請提出一種數據庫分級分類方法、系統、裝置及存儲介質。
第一方面,本申請實施例提供了一種數據庫分級分類方法,包括:對數據庫中數據屬性字段對應的數據進行抽取,獲得字段信息;根據所述數據屬性字段和所述字段信息,構建數據庫綜合信息體;對所述數據庫綜合信息體內的所述字段信息進行數據識別,獲得所述字段信息對應的識別標簽;根據所述識別標簽和預設的分級分類關聯樹,確定所述字段信息對應的分級分類結果;對所述分級分類結果進行展示。
可選地,所述識別標簽包括第一標簽和第二標簽,所述對所述數據庫綜合信息體內的數據進行數據識別,獲得所述字段信息對應的識別標簽,包括:將所述字段信息輸入字典識別模型進行第一識別,獲得所述第一標簽;將在所述第一識別中的未識別字段信息輸入關鍵字識別模型中進行第二識別,獲得所述第二標簽。
可選地,所述識別標簽還包括第三標簽,所述將所述第一識別中的未識別字段信息輸入關鍵字識別模型中進行第二識別,獲得所述第二標簽這一步驟之后,還包括:將在所述第二識別中的所述未識別字段信息輸入規則識別模型進行第三識別,獲得第三標簽;其中,所述第三識別包括正向規則匹配和逆向規則匹配。
可選地,所述識別標簽還包括第四標簽,將在所述第二識別中的未識別字段信息輸入規則識別模型進行第三識別,獲得第三標簽這一步驟之后,還包括:將在所述第三識別中的所述未識別字段信息進行聚類,確定多組字段信息簇;其中,所述字段信息簇中包含多個所述字段信息;對所述字段信息簇的聚類中心進行人工識別,確定所述字段信息簇中所有字段信息對應的第四標簽。
可選地,所述對所述數據庫綜合信息體內的所述字段信息進行數據識別,獲得所述字段信息對應的識別標簽,包括:根據所述識別過程中的命中頻率和所述所述識別標簽的權重,確定各個識別過程的置信度;根據所述置信度,確定需要進行下一階段識別的所述未識別字段信息。
可選地,所述方法還包括:根據所述分級分類結果配置安全存儲策略;根據所述安全存儲策略,確定數據庫中的敏感分級分類;對所述敏感分級分類進行安全處理;其中,所述安全處理包括定時掃描、數據加密和數據脫敏;完成安全處理后,輸出稽核報告。
可選地,所述方法還包括:存儲所述敏感分級分類的訪問記錄;限制所述敏感分級分類的訪問權限;存儲所述敏感分級分類的數據的流向路徑。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼愛音樂文化科技有限公司,未經天翼愛音樂文化科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210734483.2/2.html,轉載請聲明來源鉆瓜專利網。





