[發明專利]基于內容相關性的文件涉密內容檢索、密級判定及標注方法有效
| 申請號: | 201210296061.8 | 申請日: | 2012-08-20 |
| 公開(公告)號: | CN102819604A | 公開(公告)日: | 2012-12-12 |
| 發明(設計)人: | 徐亮;譚煌 | 申請(專利權)人: | 徐亮;譚煌 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 長沙正奇專利事務所有限責任公司 43113 | 代理人: | 何為;李宇 |
| 地址: | 410081 湖南省長*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 內容 相關性 文件 檢索 密級 判定 標注 方法 | ||
1.一種基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于依次包括以下步驟:
A、加載步驟:加載文檔所屬范圍的涉密關鍵詞及匹配規則庫、本體庫和定密規則庫;
B、解析步驟:對文檔中的文字進行分詞操作,并解析出該文檔所包含圖片、視頻、音頻中隱含的信息;
C、檢索步驟:對解析后的文檔進行基于內容相關性的語義檢索,根據語義關聯度的大小來判斷文檔中相關信息與涉密關鍵詞的內容相關性的大小,檢索出文檔中的涉密內容及該涉密內容在文檔中的范圍;
D、密級確定步驟:根據檢索結果和所屬范圍的定密規則庫,確定文檔中涉密內容的密級;
E、標注步驟:對文檔中確定了密級的涉密內容進行標注,生成標注文檔。
2.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于還包括自學習步驟:對不屬于已有范圍的文檔,對文檔進行完檢索后,提取相應的關鍵字和匹配規則,加入到默認的涉密關鍵詞及匹配規則庫中。
3.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于還包括步驟F:根據對整個文檔的密級標注進行分析統計,給出文檔中各個密級內容的統計信息,依據設定的文檔密級確定規則給出整個文檔的密級判定,并對其進行標注。
4.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于還包括步驟G:從文檔中提取相關信息,如提取相應的關鍵字、生成內容摘要、給出該文檔應屬的部門、定密時間等,制成該文檔的定密審批表和加了密級標注的文檔。
5.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述加載步驟中文檔所屬范圍的涉密關鍵詞及匹配規則庫是指該文檔所屬的某一特定領域范圍或某一特定部門已知的所有涉密關鍵詞集合,和該領域、部門判斷是否是涉密信息的相關文字的語法、語義規則的集合以及相關圖片涉密信息的匹配規則集合。
6.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述加載步驟中,對于不確定文檔所屬領域的,采用默認的涉密關鍵詞及匹配規則庫,該默認的涉密關鍵詞及匹配規則庫是由所有的部門關鍵詞詞庫和匹配規則中使用頻率最高的一些關鍵詞和匹配規則組成。
7.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述加載步驟中,若選擇了默認的涉密關鍵詞及匹配規則庫,則根據初次匹配的結果,分析得出該文檔所屬的領域或部門,再加載該部門的涉密關鍵詞及匹配規則庫進行進一步的分析匹配。
8.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述檢索步驟中,根據文檔的分詞結果和加載的所屬范圍的涉密關鍵詞詞庫及本體庫查找文檔中的涉密關鍵詞,并利用基于內容相關性的語義檢索,依次檢索出文檔中與找到的涉密關鍵詞有內容相關性的詞語、句子和段落,將檢索出的與涉密關鍵詞有內容相關性的信息按其相關程度的大小,加入到有內容相關性的語義關聯網中,再將語義關聯網中構建的關系與涉密匹配規則庫的規則比較,檢索出涉密的語句、段落。
9.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述解析步驟中的分詞操作與多核并行計算相結合。
10.根據權利要求1所述的基于內容相關性進行涉密內容檢索、密級確定及標注的方法,其特征在于,所述標注步驟中,采用加密技術對生成的標注文檔做加密處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于徐亮;譚煌,未經徐亮;譚煌許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210296061.8/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





