[發明專利]一種非結構化文檔的數據模塊轉化方法和裝置有效
| 申請號: | 201410829893.0 | 申請日: | 2014-12-26 |
| 公開(公告)號: | CN105786921B | 公開(公告)日: | 2019-06-18 |
| 發明(設計)人: | 劉劍;梁偉杰;連光耀 | 申請(專利權)人: | 北京航天測控技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 梁軍 |
| 地址: | 100041 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結構 文檔 數據 模塊 轉化 方法 裝置 | ||
本發明公開了一種非結構化文檔的數據模塊轉化方法和裝置。該方法包括:選定待轉化的非結構化文檔;對所述待轉化的非結構化文檔進行預標簽化處理,確定轉化數據目標分類;根據所述轉化數據目標分類,生成符合交互式電子技術手冊IETM標準的數據模塊需求列表DMRL;根據所述DMRL,將所述待轉化的非結構化文檔轉化為多個數據模塊。本發明通過在非結構化文檔中插入預設的標簽,來提取非結構化文檔中各種類別的內容,進而轉化出多種數據模塊。本發明提高IETM的編寫效率,降低了人工編寫IETM的工作量。
技術領域
本發明涉及信息數據交換技術領域,特別是涉及一種非結構化文檔的數據模塊轉化方法和裝置。
背景技術
在飛機、鐵路、船舶等大型設備的售后服務、客戶服務、設備保障領域,會使用大量的設備維修文件,這些技術文件在使用過程中,存在占用存儲空間大、難以攜帶、管理、查找、使用不方便、使用效率低等問題,為了解決以上問題,比較好的途徑就是使用一種數據組織模式、數據描述方法,通過數據的再組織、再利用,將多種形式的數據(比如文本、視頻、音頻、三維)集成在一起,綜合化展現設備、設備的維護保養、故障診斷等過程。這其中用到的一種技術就是交互式電子技術手冊(Interactive Electronic Technical Manual,簡稱IETM)。
IETM應用在技術資料的電子化、標準化、綜合管理、設備的使用指導、設備的故障維修、設備的訓練考核、設備的維修履歷管理等過程中,在提高設備、設備故障診斷效率的同時,降低了其維護保障費用。
IETM作為一種設備保障的重要工具,但是,IETM屬于新事物,在設備研制階段未安排IETM的制作工作,從而導致在設備研制完成后,不得不重新編寫IETM,這無疑將帶來巨大的人力投入和工作量,同時也可能造成數據不一致的情況。如何從設備的原始資料文件等大量非結構化數據(比如WORD格式文件)中提取數據,生成IETM相應的數據模塊內容,將影響IETM的制作過程。
發明內容
基于上述技術問題,本發明提供了一種非結構化文檔的數據模塊轉化方法和裝置。
為解決上述技術問題,本發明是通過以下技術方案來解決的。
本發明提供了一種非結構化文檔的數據模塊轉化方法,包括:選定待轉化的非結構化文檔;對所述待轉化的非結構化文檔進行預標簽化處理,確定轉化數據目標分類;根據所述轉化數據目標分類,生成符合交互式電子技術手冊IETM標準的數據模塊需求列表DMRL;根據所述DMRL,將所述待轉化的非結構化文檔轉化為多個數據模塊。
其中,對所述待轉化的非結構化文檔進行預標簽化處理,確定轉化數據目標分類,包括:在所述待轉化的非結構化文檔中的相應位置插入預設類型的標簽,使每個標簽對應相應類型的數據模塊。
其中,所述標簽包括以下之一:<system>、<descript>、<proced>、<fault>、<process>;在將所述標簽插入所述待轉化的非結構化文檔中的相應位置后,所述標簽包括:節點類型、節點名稱和節點內容。
其中,根據所述轉化數據目標分類,生成符合交互式電子技術手冊IETM標準的數據模塊需求列表DMRL,包括:獲取標簽為<system>的節點類型和節點名稱,并配置對應的SNS編碼;獲取標簽為<descript>、<fault>、<process>的節點類型和節點名稱,分別配置對應的類型編碼;根據節點類型與數據模塊的對應關系,按照DMRL數據格式,自動生成包含每個標簽的節點類型、節點名稱和編碼的DMRL。
其中,根據所述DMRL,將所述待轉化的非結構化文檔轉化為多個數據模塊,包括:根據生成的DMRL,在非結構化文檔中進行節點內容提取;針對提取出的多個節點內容,按照IETM數據格式標準,分別轉化為相應數據格式的數據模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天測控技術有限公司,未經北京航天測控技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410829893.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種缺失電子地圖數據的確定方法和設備
- 下一篇:界面標簽的展現方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





