[發(fā)明專利]一種基于數(shù)據(jù)內(nèi)容識(shí)別的文件標(biāo)密方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110658517.X | 申請(qǐng)日: | 2021-06-15 |
| 公開(kāi)(公告)號(hào): | CN113378222A | 公開(kāi)(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計(jì))人: | 秦凱;喻波;王聞馨;王志海;安鵬 | 申請(qǐng)(專利權(quán))人: | 北京明朝萬(wàn)達(dá)科技股份有限公司 |
| 主分類號(hào): | G06F21/62 | 分類號(hào): | G06F21/62;G06N20/00 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100142 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 內(nèi)容 識(shí)別 文件 方法 系統(tǒng) | ||
本發(fā)明提供一種基于數(shù)據(jù)內(nèi)容識(shí)別的文件標(biāo)密方法及系統(tǒng)。其中所述方法包括:將外部文件做文件導(dǎo)入,得到導(dǎo)入文件;對(duì)導(dǎo)入文件的內(nèi)容進(jìn)行識(shí)別分析,判斷文件中是否存在相關(guān)敏感信息,確認(rèn)所述敏感信息出現(xiàn)的頻率、位置;再根據(jù)所述敏感信息和所述敏感信息出現(xiàn)的頻率、位置進(jìn)行文件的分類分級(jí);根據(jù)文件的分類分級(jí)的結(jié)果進(jìn)行文件標(biāo)密,得到標(biāo)密信息;將所述導(dǎo)入文件的文件信息和所述標(biāo)密信息保存至數(shù)據(jù)庫(kù)中;返回標(biāo)密結(jié)果并在人機(jī)交互層中展示標(biāo)密結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及文檔智能標(biāo)密技術(shù)領(lǐng)域,尤其是涉及一種基于數(shù)據(jù)內(nèi)容識(shí)別的文件標(biāo)密方法及系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡(luò)的普及化,網(wǎng)絡(luò)通訊已融入當(dāng)代社會(huì)生產(chǎn)生活的方方面面,通訊信息的安全保密問(wèn)題也逐漸為人們所重視。發(fā)送者通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)文件傳輸?shù)耐瑫r(shí)也使發(fā)送成功的文件脫離了發(fā)送者的控制,發(fā)送者很難對(duì)已發(fā)送文件的使用與傳播進(jìn)行限制,從而使發(fā)送者面臨已發(fā)送的文件被濫用或惡意傳播的危險(xiǎn)。為解決上述問(wèn)題,現(xiàn)有技術(shù)通過(guò)對(duì)文件追加隱藏標(biāo)簽或者變更文件屬性等方式,確保了傳輸和復(fù)制過(guò)程中標(biāo)簽不丟失,實(shí)現(xiàn)對(duì)上述場(chǎng)景中文件的可追溯可跟蹤。并且標(biāo)簽信息與文件涉密范圍、等級(jí)密切相關(guān)。本專利是在現(xiàn)有標(biāo)密技術(shù)的基礎(chǔ)上對(duì)標(biāo)密過(guò)程中一些已知的缺陷問(wèn)題進(jìn)一步的完善補(bǔ)充。
如圖6所示,目前現(xiàn)有技術(shù)為:
1.文件標(biāo)密系統(tǒng)由數(shù)據(jù)庫(kù)模塊、標(biāo)密模塊和關(guān)聯(lián)模塊組成;
2.數(shù)據(jù)庫(kù)模塊存放所有標(biāo)密后文件的信息:包裹文件元數(shù)據(jù)、標(biāo)密信息等;
3.標(biāo)密模塊實(shí)現(xiàn)標(biāo)密過(guò)程和識(shí)別標(biāo)密文件的過(guò)程;
4.關(guān)聯(lián)模塊為主要的交互層,負(fù)責(zé)將標(biāo)密的信息傳輸?shù)綐?biāo)密模塊。
公開(kāi)號(hào)為CN104657677A公布了一種基于交換數(shù)據(jù)流的文件標(biāo)密方法,通過(guò)交換數(shù)據(jù)流將要標(biāo)密的文件數(shù)據(jù)寫到NTFS卷上,從而實(shí)現(xiàn)文件標(biāo)密,包括為該文件創(chuàng)建的擴(kuò)展數(shù)據(jù)流;設(shè)置文件密級(jí)標(biāo)識(shí)信息,包括標(biāo)密人和密級(jí),并自動(dòng)獲取標(biāo)密時(shí)間;輸入標(biāo)密標(biāo)識(shí)口令,作為驗(yàn)證口令;調(diào)用文件I/O,將設(shè)置的文件密級(jí)標(biāo)識(shí)信息寫入文件擴(kuò)展數(shù)據(jù)流,完成標(biāo)密。
目前現(xiàn)有技術(shù)缺點(diǎn)為:
1.人為標(biāo)密:人為主觀判斷進(jìn)行標(biāo)密,具有不確定性;
2.元數(shù)據(jù)標(biāo)密:支持結(jié)構(gòu)化數(shù)據(jù),不能滿足非結(jié)構(gòu)化數(shù)據(jù)需要。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于數(shù)據(jù)內(nèi)容識(shí)別的文件標(biāo)密方法及系統(tǒng),以解決現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題。
本發(fā)明第一方面提供了一種基于數(shù)據(jù)內(nèi)容識(shí)別的文件標(biāo)密方法,包括:
S1:將外部文件做文件導(dǎo)入,得到導(dǎo)入文件;
S2:對(duì)導(dǎo)入文件的內(nèi)容進(jìn)行識(shí)別分析,判斷文件中是否存在相關(guān)敏感信息,確認(rèn)所述敏感信息出現(xiàn)的頻率、位置;
S3:再根據(jù)所述敏感信息和所述敏感信息出現(xiàn)的頻率、位置進(jìn)行文件的分類分級(jí);
S4:根據(jù)文件的分類分級(jí)的結(jié)果進(jìn)行文件標(biāo)密,得到標(biāo)密信息;
S5:將所述導(dǎo)入文件的文件信息和所述標(biāo)密信息保存至數(shù)據(jù)庫(kù)中;
S6:返回標(biāo)密結(jié)果并在人機(jī)交互層中展示標(biāo)密結(jié)果。
優(yōu)選的,所述對(duì)導(dǎo)入的文件的內(nèi)容進(jìn)行識(shí)別分析,判斷文件中是否存在相關(guān)敏感信息的具體方法為:格式轉(zhuǎn)換、內(nèi)容提取、內(nèi)容識(shí)別;
所述格式轉(zhuǎn)換主要是對(duì)導(dǎo)入文件進(jìn)行格式類型識(shí)別、解析和轉(zhuǎn)換,得到格式轉(zhuǎn)換文件;
所述內(nèi)容提取為,將格式轉(zhuǎn)換文件中提取文件內(nèi)容,得到文件提取內(nèi)容;
內(nèi)容識(shí)別為,對(duì)文件提取內(nèi)容進(jìn)行預(yù)設(shè)信息提取,判斷文件中是否存在相關(guān)敏感信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明朝萬(wàn)達(dá)科技股份有限公司,未經(jīng)北京明朝萬(wàn)達(dá)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110658517.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





