[發明專利]基于修改標識符的OOX文本文檔隱私信息檢測方法有效
| 申請號: | 201510340530.5 | 申請日: | 2015-06-18 |
| 公開(公告)號: | CN105046159B | 公開(公告)日: | 2018-04-03 |
| 發明(設計)人: | 吳檳;何曉磊;趙險峰;劉磊 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 余長江 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 修改 標識符 oox 文本 文檔 隱私 信息 檢測 方法 | ||
1.一種基于修改標識符的OOX文本文檔隱私信息檢測方法,其步驟包括:
1)將待檢測的OOX文本文檔進行解壓,形成層次化文件結構,該層次化文件結構中包含document.xml和settings.xml文件;
2)提取解壓得到的document.xml和settings.xml文件中的修改標識符,并將提取的該兩個文件的修改標識符分別保存到兩個容器中;
3)對比兩個容器中修改標識符的異同,進而統計出OOX文本文檔所攜帶的總的隱私信息的數量;如果settings.xml文件中的修改標識包含document.xml文件中所有修改標識符,則判定OOX文本文檔中不含有隱私信息,否則判定OOX文本文檔中包含有隱私信息;
該步驟對OOX文本文檔所攜帶的隱私信息進行統計的過程如下,其中document.xml和settings.xml文件中的修改標識符分別保存到容器vector1和容器vector2中:
3-1)提取vector1保存的第一個修改標識符;
3-2)將步驟3-1)提取到的修改標識符通過int FindXs1FromXs()函數在vector2中進行二分查找;
3-3)如果vector2中包含該修改標識,表明該修改標識符沒有被修改過;如果沒有找到,則文檔所攜帶的隱私信息統計量加1;
3-4)按照上述步驟循環提取vector1中的每一個修改標識符,直到遍歷完vector1中所有的元素為止,最后得到文檔所攜帶的總的隱私信息量。
2.如權利要求1所述的方法,其特征在于:步驟1)采用Unzip軟件進行所述解壓。
3.如權利要求2所述的方法,其特征在于,步驟1)進行所述解壓的步驟包括:
1-1)利用unzOpen64()函數打開OOX文本文檔,在函數內部生成一個unz64_s的結構體;
1-2)使用unzGoToFirstFile()函數得到OOX文本文檔中第一個文件的數據;
1-3)調用unzOpenCurrentFil()函數,讀取文件中的數據,利用unz64local_GetCurrentFileInfoInternal()函數得到文件的名字;
1-4)通過strcmp()函數對比得到的文件名是否是“document.xml”和“settings.xml”中的一種,如果判斷是其中的一種,通過fwrite()函數寫入到相應的路徑下;
1-5)調用unzGoToNextFile()函數得到OOX文本文檔中下一個的數據文件;循環執行該unzGoToNextFile()函數,直到將document.xml和settings.xml文件全部解壓出來為止;
1-6)通過unzClose()函數關閉OOX文本文檔。
4.如權利要求1所述的方法,其特征在于:步驟2)將document.xml文件中的修改標識符保存到容器中時,進行去重和排序操作。
5.如權利要求4所述的方法,其特征在于:步驟2)提取document.xml文件中的修改標識符的步驟包括:
2-1a)利用libxml庫中的xmlReadMemory()函數對內存中的document.xml文件進行讀取,返回xmlDocPtr指針;
2-1b)利用xmlDocGetRootElement()函數得到文件的根節點;
2-1c)得到根節點之后,利用遞歸遍歷document.xml中的所有節點及其子節點,通過compare()函數尋找節點中的包含字符串“rsid”的屬性,提取對應的屬性值即修改標識,并且將其放入到一個容器中;
2-1d)在插入到容器中時,利用VectorSortedPosIndexOf()函數查找該修改標識符,并且得到要插入的位置,如果已經在容器中,則丟棄該修改標識符,繼續插入下一個修改標識符;如果不在容器中,根據VectorSortedPosIndexOf()函數中ipos的值判斷要插入的位置,以保證插入到容器中的修改標識符是有序且不重復的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510340530.5/1.html,轉載請聲明來源鉆瓜專利網。





