[發(fā)明專利]索引文章的創(chuàng)建方法和裝置在審
| 申請?zhí)枺?/td> | 201210130980.8 | 申請日: | 2012-04-27 |
| 公開(公告)號: | CN103377255A | 公開(公告)日: | 2013-10-30 |
| 發(fā)明(設計)人: | 孔峰;蘇勇 | 申請(專利權)人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 索引 文章 創(chuàng)建 方法 裝置 | ||
1.一種索引文章的創(chuàng)建方法,其特征在于,包括:
從文檔正文中獲取索引標識符以形成索引條目集合;
對所述索引條目集合創(chuàng)建排序樹;
遍歷所述排序樹以創(chuàng)建索引文章。
2.根據(jù)權利要求1所述的方法,其特征在于,從文檔正文中獲取索引標識符以形成索引條目集合包括:
遍歷所述正文的所有頁中的文字內容;
判斷當前頁的文字內容中的當前字符是否為索引標識符;
如果是,則獲取所述索引標識符,以各個所述索引標識符分別構成一個索引條目,將各個所述索引條目構成所述索引條目集合。
3.根據(jù)權利要求1所述的方法,其特征在于,對所述索引條目集合創(chuàng)建排序樹包括:
創(chuàng)建根節(jié)點;
判斷各個所述索引條目相互的從屬關系;
根據(jù)預先設置的級別規(guī)則對所述從屬關系的規(guī)定,將所述索引條目插入到以所述根節(jié)點創(chuàng)建的所述排序樹中。
4.根據(jù)權利要求3所述的方法,其特征在于,根據(jù)預先設置的級別規(guī)則對所述從屬關系的規(guī)定,將所述索引條目插入到以所述根節(jié)點創(chuàng)建的所述排序樹中包括:
如果所述索引條目中的第一索引條目從屬于所述索引條目中的第二索引條目,則將所述第一索引條目設置為所述第二索引條目所對應的節(jié)點的子節(jié)點。
5.根據(jù)權利要求1所述的方法,其特征在于,遍歷所述排序樹以創(chuàng)建索引文章包括:
深度遍歷所述排序樹;
將當前的節(jié)點作為一個索引段落信息加入到索引段落信息數(shù)組中;
根據(jù)所述索引段落信息數(shù)組創(chuàng)建所述索引文章。
6.根據(jù)權利要求5所述的方法,其特征在于,根據(jù)所述索引段落信息數(shù)組創(chuàng)建所述索引文章包括:
根據(jù)所述索引段落信息數(shù)組中的各個所述索引段落信息構建所述索引文章中的一個段落。
7.一種索引文章的創(chuàng)建裝置,其特征在于,包括:
集合模塊,用于從文檔正文中獲取索引標識符以形成索引條目集合;
排序樹模塊,用于對所述索引條目集合創(chuàng)建排序樹;
索引文章模塊,用于遍歷所述排序樹以創(chuàng)建索引文章。
8.根據(jù)權利要求7所述的裝置,其特征在于,所述集合模塊包括:
遍歷模塊,用于遍歷所述正文的所有頁中的文字內容;
判斷模塊,用于判斷當前頁的文字內容中的當前字符是否為索引標識符;
獲取模塊,用于如果是,則獲取所述索引標識符,以各個所述索引標識符分別構成一個索引條目,將各個所述索引條目構成所述索引條目集合。
9.根據(jù)權利要求7所述的裝置,其特征在于,所述排序樹模塊包括:
根節(jié)點模塊,用于創(chuàng)建根節(jié)點;
關系模塊,用于判斷各個所述索引條目相互的從屬關系;
插入模塊,用于根據(jù)預先設置的級別規(guī)則對所述從屬關系的規(guī)定,將所述索引條目插入到以所述根節(jié)點創(chuàng)建的所述排序樹中。
10.根據(jù)權利要求7所述的裝置,其特征在于,所述索引文章模塊包括:
深度遍歷模塊,用于深度遍歷所述排序樹;
加入模塊,用于將當前的節(jié)點作為一個索引段落信息加入到索引段落信息數(shù)組中;
創(chuàng)建模塊,用于根據(jù)所述索引段落信息數(shù)組創(chuàng)建所述索引文章。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210130980.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:北斗GPS多模車輛智能終端的雙天線GPRS通信裝置
- 下一篇:開關電源
- 圖冊創(chuàng)建設備、圖冊創(chuàng)建方法和圖冊創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對象的方法
- 報告創(chuàng)建系統(tǒng)、報告創(chuàng)建裝置以及報告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報創(chuàng)建方法和剪報創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報告創(chuàng)建系統(tǒng)和報告創(chuàng)建方法
- 創(chuàng)建改進的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法





