[發明專利]一種通用的文本水印方法和裝置有效
| 申請號: | 202210100368.X | 申請日: | 2022-01-27 |
| 公開(公告)號: | CN114708133B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 李公寶;叢升日 | 申請(專利權)人: | 北京國隱科技有限公司 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;G06F40/109 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100084 北京市海淀區上地信息路1號*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通用 文本 水印 方法 裝置 | ||
1.一種通用的文本水印方法,其特征在于,包括以下步驟:
根據特定策略對選定字庫中一定數目的字符進行分組;
根據特定規則對每個分組中的所有字符進行變形設計,并生成水印字符數據臨時文件;
生成用戶終端水印編碼數據,用以標識用戶終端的身份認證信息;
依據水印編碼數據,并結合水印字符數據臨時文件和分組的字符,動態生成并實時加載水印字庫文件;
運行電子格式的文本文件,在文件打印輸出和屏幕顯示的文檔內容數據中利用水印字庫文件實時嵌入水印信息;
所述的對選定字庫中一定數目的字符進行分組,包括:
首先,按照字頻統計結果從高到低對常見字符進行排序,并獲取前N個字符組成水印字符集
接著,將N個字符初步劃分為M組,記為{Ω1,Ω1,…,ΩM},其中MN,并且使得任意的0i,j≤M,i≠j,具體分組過程包括:
Step1.先按照字頻順序選取前M個字符依次分到{Ω1,Ω1,…,ΩM}個各組中,每個分組中增加一個字符;
Step2.再次選取M個字符按照相反的順序{ΩM,ΩM-1,…,Ω1}依次在每個分組中增加一個字符;
Step3.重復執行Step1和Step2直至N個字符分組完畢;
然后,隨機選取一定數量的文本訓練語料,并將每一份文本訓練語料的字符數固定在t個;
最后,統計所有分組{Ω1,Ω1,…,ΩM}中的字符在t個文本訓練語料中出現的概率,并根據概率分布對分組結果進行優化得到最終的分組{Ω′1,Ω′2,…,Ω′M}。
2.根據權利要求1所述的方法,其特征在于,還包括以下步驟:
獲取隱藏有水印信息的文檔圖片數據,并進行水印信息提取,進而進行文檔泄密源頭追溯。
3.根據權利要求1或2所述的方法,其特征在于,所述的根據概率分布對分組結果進行優化得到最終的分組,包括:
Step1,計算每個分組Ωi,1≤i≤M中的字符在t個文本訓練語料中出現的概率,并將所有的概率按照從大到小的順序進行排序;
Step2,從概率最高的分組中取出字頻最小的字符移動到概率最低的分組中,從概率次高的分組中取出字頻次小的字符移動到概率次低的分組中,依次重復該過程直至移動全部完成;
Step3,再次重復執行Step1和Step2,直至所有分組的概率方差達到最小,從而得到最終的分組{Ω′1,Ω′2,…,Ω′M}。
4.根據權利要求1或2所述的方法,其特征在于,所述的對每個分組中的所有字符進行變形設計,是指將字符的矢量輪廓曲線數據進行調整得到d個不同的變形,d≥2,不同的輪廓曲線變形代表不同的水印信息位串;每個分組中的所有字符都代表相同的水印信息位串;所述的生成水印字符數據臨時文件,是指將設計生成的字符變形輪廓曲線數據連同字符屬性描述信息一起保存在臨時文件中,字符屬性描述信息包括字體框的寬度、字體框的高度、每個字形在字體框中的偏移量,其中偏移量會隨著字形結構的不同從而發生變化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國隱科技有限公司,未經北京國隱科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210100368.X/1.html,轉載請聲明來源鉆瓜專利網。





