[發明專利]一種文件摘要的提取方法有效
| 申請號: | 201110375121.0 | 申請日: | 2011-11-23 |
| 公開(公告)號: | CN102364458A | 公開(公告)日: | 2012-02-29 |
| 發明(設計)人: | 趙樹喬 | 申請(專利權)人: | 趙樹喬 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅文群 |
| 地址: | 100101*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文件 摘要 提取 方法 | ||
1.一種文件摘要提取方法,其特征在于該方法包括以下各步驟:
(1)生成一個由多個字節組成的字節序列,字節序列中每個字節的值互不相同;
(2)將文件按照單位長度切分為一個或多個數據塊,;
(3)分別掃描組成上述各數據塊的字節取值,將該字節取值與上述字節序列中各字 節取值進行比較,分別統計數據塊的字節取值與上述字節序列中的字節取值相等的字節數 量;
(4)設定一個非數字的數量分隔符,使得該分隔符與表示上述字節數量的符號不相 等,依次檢查一個或多個數據塊中的所有字節數量的符號,當字節數量符號超過一個時, 在該字節數量符號的兩側添加該數量分隔符,將所有字節數量和數量分隔符組成一個或多 個中間序列;
(5)設定一個非數字的符號作為邊界分隔符,該邊界分隔符與上述數量分隔符和上 述數量符號不相等;
(6)將上述多個中間序列依次相互連接,每兩個中間序列之間添加上述邊界分隔符, 得到文件摘要。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于趙樹喬,未經趙樹喬許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110375121.0/1.html,轉載請聲明來源鉆瓜專利網。





