[發(fā)明專利]計(jì)算機(jī)系統(tǒng)涉密文件搜索方法有效
| 申請(qǐng)?zhí)枺?/td> | 200910156814.3 | 申請(qǐng)日: | 2009-12-31 |
| 公開(kāi)(公告)號(hào): | CN101763394A | 公開(kāi)(公告)日: | 2010-06-30 |
| 發(fā)明(設(shè)計(jì))人: | 傅如毅 | 申請(qǐng)(專利權(quán))人: | 傅如毅 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 杭州華鼎知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33217 | 代理人: | 韓洪 |
| 地址: | 311800 浙江省諸暨*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算機(jī)系統(tǒng) 文件 搜索 方法 | ||
【技術(shù)領(lǐng)域】
本發(fā)明涉及對(duì)計(jì)算機(jī)系統(tǒng)中存放的涉密文件進(jìn)行搜索的方法。
【背景技術(shù)】
信息技術(shù)的快速發(fā)展大力推動(dòng)了計(jì)算機(jī)網(wǎng)絡(luò)與信息系統(tǒng)在政府及企事業(yè) 單位的廣泛應(yīng)用,為辦公及生產(chǎn)建設(shè)的電子化、自動(dòng)化提供了堅(jiān)實(shí)保障,同時(shí), 各種涉密信息也大量以電子文件的形式存儲(chǔ)于計(jì)算機(jī)系統(tǒng)中。這種涉密文件在 非涉密計(jì)算機(jī)上的存在,給信息安全帶來(lái)了嚴(yán)重隱患,尤其在政府內(nèi)網(wǎng)(公安、 檢察院、法院、政府、財(cái)稅、電力等等領(lǐng)域)環(huán)境中,防止涉密文件的非法存 儲(chǔ)可以說(shuō)已成為國(guó)家安全保密工作的重中之重。現(xiàn)有的涉密文件搜索程序基本 上采用關(guān)鍵字查找方法,對(duì)涉密文件的搜索工作并無(wú)太好使用效果,這主要是 由于以下幾方面的缺點(diǎn)造成的:
1、搜索結(jié)果準(zhǔn)確性不高。設(shè)定的關(guān)鍵字可能會(huì)在涉密文件中存在,但也有 其他許多文檔會(huì)存在相同關(guān)鍵字內(nèi)容,使用關(guān)鍵字搜索的方法必然導(dǎo)致搜索到 的結(jié)果中包含了大量的非涉密文件,仍需人工進(jìn)行判斷,這對(duì)計(jì)算機(jī)中存在大 量文件或者對(duì)大量計(jì)算機(jī)進(jìn)行搜索檢查時(shí)效率不高。
2、搜索結(jié)果完整性不強(qiáng)。涉密文件內(nèi)容各種各樣,無(wú)法采用統(tǒng)一關(guān)鍵字的 方式涵蓋所有涉密文件內(nèi)容,導(dǎo)致搜索結(jié)果中漏掉相當(dāng)多的涉密文件,這給安 全保密工作留下隱患。
【發(fā)明內(nèi)容】
本發(fā)明的目的就是解決現(xiàn)有技術(shù)中的問(wèn)題,提出一種計(jì)算機(jī)系統(tǒng)涉密文件 搜索方法,能夠更加完整且準(zhǔn)確地發(fā)現(xiàn)計(jì)算機(jī)系統(tǒng)中存放的涉密文件,以便于 消除信息安全保密工作的隱患。
為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種計(jì)算機(jī)系統(tǒng)涉密文件搜索方法,依次 包括以下步驟:
A、解析步驟:依照不同計(jì)算機(jī)文件類型、版本,解析出文檔內(nèi)容、格式信 息;
B、搜索匹配步驟:對(duì)文檔內(nèi)容及格式特征信息按照“設(shè)定策略組合”進(jìn)行 搜索匹配,生成該文件是否被判斷為涉密文件的結(jié)果;
C、展現(xiàn)步驟:對(duì)被判斷為涉密文件的文件名、文件存放路徑進(jìn)行界面展現(xiàn)。
作為優(yōu)選,所述解析步驟中解析出文檔內(nèi)容、格式信息是指根據(jù)文件后 綴名和文件內(nèi)容中的特征字節(jié)聯(lián)合判斷,解析文檔的結(jié)構(gòu)化存儲(chǔ)格式或純文本, 提取出文檔內(nèi)容和格式信息,所述文檔內(nèi)容是指文字和圖片內(nèi)容,所述格式信 息是指字體、字號(hào)、字符和顯示位置等等信息。
作為優(yōu)選,所述解析步驟中采用二進(jìn)制碼解析方法,二進(jìn)制搜索可不依 賴操作系統(tǒng)是否安裝有待解析文檔的編輯軟件,所述待解析文檔的編輯軟件是 指Microsoft?Office軟件或PDF軟件或WinRAR軟件或WPS軟件。
作為優(yōu)選,所述解析步驟中也可以采用二進(jìn)制碼以外(包括字符、文字 等等)的其他解析方法,并相應(yīng)調(diào)整搜索匹配步驟中的“設(shè)定策略組合”的碼 的類型。或者采用二進(jìn)制碼與二進(jìn)制碼以外的解析方法結(jié)合解析。二進(jìn)制碼以 外的方法是指采用操作系統(tǒng)的搜索接口進(jìn)行解析或者采用待解析文檔的編輯軟 件搜索接口進(jìn)行解析,所述編輯軟件是指Microsoft?Office軟件或PDF軟件或 WPS軟件。
所述搜索匹配步驟中的“設(shè)定策略組合”是指根據(jù)展現(xiàn)在打印稿中的不同 密級(jí)(絕密文件、機(jī)密文件、秘密文件、內(nèi)部文件等)、不同類型、不同行業(yè)的 涉密文件分析出多個(gè)特征點(diǎn)(可分為重要特征點(diǎn)、一般特征點(diǎn)),多個(gè)特征點(diǎn)之 間進(jìn)行“與”、“或”、“非”中至少一種的組合來(lái)搜索匹配,然后編譯到計(jì)算機(jī) 能識(shí)別的語(yǔ)言。
作為優(yōu)選,所述搜索匹配步驟中的“設(shè)定策略組合”采用兩種策略進(jìn)行 組合搜索,一種是可選擇全面搜索策略或精確搜索策略;另一種是可選擇普密 級(jí)搜索策略或絕密級(jí)搜索策略或秘密級(jí)搜索策略或內(nèi)部文檔搜索策略。不同密 級(jí)有絕密文件、機(jī)密文件、秘密文件、內(nèi)部文件等,分析出不同密級(jí)、不同類 型、不同行業(yè)的共性的重要特征點(diǎn)、一般特征點(diǎn),歸納出一些差異的特征點(diǎn), 這些特征點(diǎn)包括關(guān)鍵字、字符、位置、格式等信息。
作為優(yōu)選,所述搜索匹配步驟中的“設(shè)定策略組合”可以選擇采用全面 搜索策略、精確搜索策略、普密級(jí)搜索策略、絕密級(jí)搜索策略。
作為優(yōu)選,所述搜索匹配步驟中可選擇對(duì)文件頭部分和/或文件尾部分進(jìn) 行查找匹配。在匹配步驟中采用只對(duì)文件開(kāi)頭部分和/或結(jié)尾部分進(jìn)行匹配運(yùn)算 的方法后,可加快涉密文件搜索速度,提高計(jì)算機(jī)系統(tǒng)涉密文件搜索的效率。
作為優(yōu)選,所述展現(xiàn)步驟中可按密級(jí)排序展現(xiàn),并可根據(jù)搜索策略匹配 程度按判斷可能性的百分比排序展現(xiàn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于傅如毅,未經(jīng)傅如毅許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910156814.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:真空清潔器濾袋
- 下一篇:平版印刷版用鋁合金板的制造裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 允許服務(wù)器遠(yuǎn)程訪問(wèn)未通電的客戶計(jì)算機(jī)系統(tǒng)資產(chǎn)信息的數(shù)據(jù)處理系統(tǒng)和方法
- 無(wú)需用戶參與自動(dòng)處理推送的信息的方法、系統(tǒng)與程序
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法
- 分配用于多方應(yīng)用層會(huì)話的資格信息
- 分配用于多方應(yīng)用層會(huì)話的資格信息
- 一種用于多層次對(duì)話的調(diào)節(jié)計(jì)算機(jī)系統(tǒng)的方法
- 一種使用混合云計(jì)算系統(tǒng)進(jìn)行通信的方法
- 遠(yuǎn)程禁止客戶計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)處理系統(tǒng)和方法
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





