[發明專利]用于對文檔進行標注的方法和設備有效
| 申請號: | 200810091289.7 | 申請日: | 2008-04-28 |
| 公開(公告)號: | CN101571859A | 公開(公告)日: | 2009-11-04 |
| 發明(設計)人: | 費奔;胡博;吳賢;張小詢;蘇中 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市金杜律師事務所 | 代理人: | 王茂華;李 輝 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 文檔 進行 標注 方法 設備 | ||
1.一種用于利用用戶輸入的標簽對文檔進行標注的方法,包括:
獲取所述文檔的結構化信息;
在標簽-文檔索引庫中檢索與輸入的標簽相對應的內容塊列表;
比較所述結構化信息中的塊與所述內容塊列表中的塊,以獲得相 似的塊;以及
在與所述相似的塊對應的所述文檔的位置處標注所述標簽。
2.根據權利要求1所述的方法,其中所述文檔的結構化信息是 根據預定方法從所述文檔抽取的。
3.根據權利要求2所述的方法,其中,所述預定方法是基于規 則的方法。
4.根據權利要求2所述的方法,其中,所述預定方法是自然語 言處理方法。
5.根據權利要求1所述的方法,還包括:在標簽與已標注文檔 的結構化信息之間建立對應關系。
6.根據權利要求5所述的方法,還包括:更新所述對應關系。
7.根據權利要求1所述的方法,還包括:生成與所述輸入的標 簽相近的推薦標簽,以及利用所述推薦標簽代替所述輸入的標簽來 重復執行所述檢索步驟、比較步驟和標注步驟。
8.一種用于對當前文檔進行標注的方法,包括:
獲取所述當前文檔的結構化信息;
比較所述當前文檔的結構化信息中的塊與已有文檔的結構化信 息中的塊,以獲得相似塊;以及
利用以前標注過與所述相似塊對應的所述已有文檔的位置的標 簽,來在與所述相似塊對應的所述當前文檔的位置處進行標注。
9.一種用于利用用戶輸入的標簽對文檔進行標注的設備,包括:
獲取裝置,用于獲取所述文檔的結構化信息;
檢索裝置,用于在標簽-文檔索引庫中檢索與輸入的標簽相對應 的內容塊列表;
比較裝置,用于比較所述結構化信息中的塊與所述內容塊列表中 的塊,以獲得相似的塊;以及
標注裝置,用于在與所述相似的塊對應的所述文檔的位置處標注 所述標簽。
10.根據權利要求9所述的設備,還包括抽取裝置,其中所述文 檔的結構化信息是由抽取裝置根據預定方法從所述文檔抽取的。
11.根據權利要求10所述的設備,其中,所述預定方法是基于 規則的方法。
12.根據權利要求10所述的設備,其中,所述預定方法是自然 語言處理方法。
13.根據權利要求9所述的設備,還包括索引裝置,用于在標簽 與已標注文檔的結構化信息之間建立對應關系。
14.根據權利要求13所述的設備,還包括更新裝置,用于更新 所述對應關系。
15.根據權利要求9所述的設備,還包括用于生成與所述輸入的 標簽相近的推薦標簽的裝置。
16.一種用于對當前文檔進行標注的設備,包括:
獲取裝置,用于獲取所述當前文檔的結構化信息;
比較裝置,用于比較所述當前文檔的結構化信息中的塊與已有文 檔的結構化信息中的塊,以獲得相似塊;以及
標注裝置,用于使用以前標注過與所述相似塊對應的所述已有文 檔的位置的標簽,來在與所述相似塊對應的所述當前文檔的位置處 進行標注。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810091289.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種體感指向遙控系統及方法
- 下一篇:用于資源傳送的方法和裝置





