[發明專利]一種采用模板方式抽取結構化信息的系統無效
| 申請號: | 201310332443.6 | 申請日: | 2013-08-02 |
| 公開(公告)號: | CN103440267A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 徐方林 | 申請(專利權)人: | 徐方林 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 蘇州廣正知識產權代理有限公司 32234 | 代理人: | 劉述生 |
| 地址: | 225000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 采用 模板 方式 抽取 結構 信息 系統 | ||
技術領域
本發明涉及信息處理軟件領域,具體的說,特別涉及到一種采用模板方式抽取結構化信息的系統。
背景技術
互連網上出現的海量信息,大概分為結構化、半結構化和非結構化三種。結構化信息如電子商務信息,信息的性質和量值的出現的位置是固定的;半結構化的信息如專業網站上的細分頻道,其標題和正文的語法相當規范,關鍵詞的范圍相當局限;非結構化的信息如BLOG和BBS,所有內容都是不可預知的。?
結構化信息和非結構化信息是IT應用的兩個世界,它們有著各自不同的應用進化特點和規律。但是,這兩個世界之間還缺少相互連接的橋梁,而這種缺失使企業中不可避免地存在“活動”、“信息和知識”的分離,其后果就是:雖然它們都在進行著“知識化”的努力,但兩個世界分離的IT應用模式,注定使其難以真正實現它們的初衷——“在最合適的時間,將最合適的信息傳送給最合適的人。
綜上所述,針對現有技術的缺陷,特別需要一種采用模板方式抽取結構化信息的系統,以解決以上提到的問題。
發明內容
本發明的目的在于提供一種采用模板方式抽取結構化信息的系統,通過采用功能化的結構設計,克服了傳統技術中的不足,從而實現本發明的目的。
本發明所解決的技術問題可以采用以下技術方案來實現:
????一種采用模板方式抽取結構化信息的系統,它包括:
目標選定單元,采用智能選能模塊,用于選定結構化信息的抽取對象;
模板配置單元,與所述的目標選定單元連接,根據選定的結構化信息的抽取對象,配置相關的抽取模板;
對象導入單元,分別與所述的目標選定單元和模板配置單元連接,用于將抽取對象和抽取模板導入系統中;
信息抽取單元,與所述的對象導入單元連接,根據抽取模板根據預先設置的信息,對抽取對象進行抽取操作,獲得需要的結構化信息。
在本發明的一個實施例中,所述抽取模板抽取的結構化信息包括營運內容、部門內容、Web內容和多媒體內容。
在本發明的一個實施例中,所述結構化信息抽取完畢后,添加信息的大小、類別、轉換日期,便于后續處理。
本發明的有益效果在于:結構簡單,設計巧妙,通過采用功能化的結構設計,克服了傳統技術中的不足,填補了相關市場的空白,從而實現本發明的目的。
附圖說明
圖1為本發明所述的采用模板方式抽取結構化信息的方法的結構框圖。
具體實施方式
為使本發明實現的技術手段、創作特征、達成目的與功效易于明白了解,下面結合具體實施方式,進一步闡述本發明。
如圖1所示,本發明所述的一種采用模板方式抽取結構化信息的系統,它包括目標選定單元100、模板配置單元200、對象導入單元300和信息抽取單元400。
所述目標選定單元采用智能選能模塊,用于選定結構化信息的抽取對象;
所述模板配置單元與所述的目標選定單元連接,根據選定的結構化信息的抽取對象,配置相關的抽取模板;
所述對象導入單元分別與所述的目標選定單元和模板配置單元連接,用于將抽取對象和抽取模板導入系統中;
所述信息抽取單元與所述的對象導入單元連接,根據抽取模板根據預先設置的信息,對抽取對象進行抽取操作,獲得需要的結構化信息。
在本發明的一個實施例中,為了增加所述方法的泛用性,所述抽取模板抽取的結構化信息包括營運內容、部門內容、Web內容和多媒體內容。
尤其需要指出的是,所述結構化信息抽取完畢后,添加信息的大小、類別、轉換日期,便于后續處理。
本發明結構簡單,設計巧妙,通過采用功能化的結構設計,克服了傳統技術中的不足,填補了相關市場的空白,從而實現本發明的目的。
以上顯示和描述了本發明的基本原理和主要特征和本發明的優點。本行業的技術人員應該了解,本發明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發明的原理,在不脫離本發明精神和范圍的前提下,本發明還會有各種變化和改進,這些變化和改進都落入要求保護的本發明范圍內。本發明要求保護范圍由所附的權利要求書及其等效物界定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于徐方林,未經徐方林許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310332443.6/2.html,轉載請聲明來源鉆瓜專利網。





