[發(fā)明專利]延伸標(biāo)記語言文件的數(shù)據(jù)擷取方法及裝置無效
| 申請?zhí)枺?/td> | 201010117010.5 | 申請日: | 2010-02-09 |
| 公開(公告)號: | CN102147801A | 公開(公告)日: | 2011-08-10 |
| 發(fā)明(設(shè)計)人: | 黃偉倫 | 申請(專利權(quán))人: | 緯創(chuàng)資通股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 史新宏 |
| 地址: | 中國臺*** | 國省代碼: | 中國臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 延伸 標(biāo)記 語言 文件 數(shù)據(jù) 擷取 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種延伸標(biāo)記語言文件的數(shù)據(jù)擷取方法及裝置,尤其涉及一種可重復(fù)使用并大幅提升使用效率的延伸標(biāo)記語言文件的數(shù)據(jù)擷取方法及裝置。
背景技術(shù)
近年來,由于互聯(lián)網(wǎng)的興盛,幾乎所有數(shù)據(jù)都必須通過網(wǎng)絡(luò)傳遞。其中,基于延伸標(biāo)記語言文件優(yōu)越的跨平臺特性及信息涵意表達(dá)能力,大部分的傳輸皆經(jīng)由延伸標(biāo)記語言文件完成。然而,即便各個網(wǎng)站皆使用延伸標(biāo)記語言文件存儲數(shù)據(jù),對于具有相同意義的元素,不同網(wǎng)站所使用的標(biāo)簽卻不盡相同。舉例而言,請參考圖1及圖2,圖1及圖2分別為一延伸標(biāo)記語言文件10及一延伸標(biāo)記語言文件20的內(nèi)容示意圖。延伸標(biāo)記語言文件10與延伸標(biāo)記語言文件20所具有的元素及架構(gòu)完全相同,但前者將標(biāo)示書籍列表的標(biāo)簽命名為<Books>,后者命名為<Booklist>。當(dāng)使用者試圖從延伸標(biāo)記語言文件10擷取出XML?guidelines及HTML?guidelines這兩個元素時,使用者必須沿<Books>/<Book>/<Name>的路徑擷取;相對地,當(dāng)使用者試圖從延伸標(biāo)記語言文件20擷取出XML?guidelines及HTMLguidelines這兩個元素時,則必須沿<Booklist>/<Book>/<Name>的路徑擷取。也就是說,為求正確地擷取延伸標(biāo)記語言文件的內(nèi)容,對于延伸標(biāo)記語言文件10及延伸標(biāo)記語言文件20必須采取兩套不同的作法。
除了標(biāo)簽命名的不同外,一般而言,不同網(wǎng)站所提供的延伸標(biāo)記語言文件的結(jié)構(gòu)也有很大的差異。舉例而言,請同時參考圖1及圖3,圖3為一延伸標(biāo)記語言文件30的示意圖。其中,標(biāo)示書籍列表的標(biāo)簽,在延伸標(biāo)記語言文件10及延伸標(biāo)記語言文件30中皆為<Books>,延伸標(biāo)記語言文件10及延伸標(biāo)記語言文件30的書籍部分所具有的元素亦完全相同,但兩份文件的結(jié)構(gòu)有所不同。當(dāng)使用者試圖從延伸標(biāo)記語言文件10擷取出XMLguidelines及HTML?guidelines這兩個元素時,使用者同樣必須沿<Books>/<Book>/<Name>的路徑擷取;相對地,當(dāng)使用者試圖從延伸標(biāo)記語言文件30擷取出XML?guidelines及HTML?guidelines這兩個元素時,則必須沿<2009>/<Books>/<Book>/<Name>的路徑擷取。也就是說,為求正確地擷取延伸標(biāo)記語言文件的內(nèi)容,對于延伸標(biāo)記語言文件10及延伸標(biāo)記語言文件30,使用者亦須采取兩套不同的作法。換句話說,為求正確地擷取延伸標(biāo)記語言文件的內(nèi)容,使用者必須針對使用不同標(biāo)簽的網(wǎng)站采取不同的作法,因而造成許多資源的浪費、以及效率的低落,實有改進的必要。
發(fā)明內(nèi)容
因此,本發(fā)明的主要目的即在于提供一可重復(fù)使用的延伸標(biāo)記語言文件的數(shù)據(jù)擷取方法及裝置。
本發(fā)明公開一種數(shù)據(jù)擷取方法,用來通過互聯(lián)網(wǎng)取得數(shù)據(jù),該數(shù)據(jù)擷取方法包含有根據(jù)一使用者指令,自一服務(wù)器端取得一延伸標(biāo)記語言文件,該延伸標(biāo)記語言文件包含多個元素(Element)對應(yīng)于多個標(biāo)簽(Tag),該使用者指令用來取得該延伸標(biāo)記語言文件中一特定元素;對該延伸標(biāo)記語言文件進行格式分析,以產(chǎn)生一格式分析結(jié)果;根據(jù)該格式分析結(jié)果,由多個模板(template)中選取一模板,該模板用來指示該多個標(biāo)簽的內(nèi)容;以及通過該模板,由該延伸標(biāo)記語言文件中取得該特定元素。
本發(fā)明另公開一種數(shù)據(jù)擷取裝置,用來通過互聯(lián)網(wǎng)取得數(shù)據(jù),該數(shù)據(jù)擷取裝置包含有一微處理器;以及一存儲器,用來存儲一程序,該程序用來指示該微處理器執(zhí)行以下步驟:根據(jù)一使用者指令,自一服務(wù)器端取得一延伸標(biāo)記語言文件,該延伸標(biāo)記語言文件包含多個元素對應(yīng)于多個標(biāo)簽,該使用者指令用來取得該延伸標(biāo)記語言文件中一特定元素;對該延伸標(biāo)記語言文件進行格式分析,以產(chǎn)生一格式分析結(jié)果;根據(jù)該格式分析結(jié)果,由多個模板中選取一模板,該模板用來指示該多個標(biāo)簽的內(nèi)容;以及通過該模板,由該延伸標(biāo)記語言文件中取得該特定元素。
附圖說明
圖1為已知一延伸標(biāo)記語言文件的示意圖。
圖2為已知一延伸標(biāo)記語言文件的示意圖。
圖3為已知一延伸標(biāo)記語言文件的示意圖。
圖4為本發(fā)明實施例一數(shù)據(jù)擷取流程的示意圖。
圖5為本發(fā)明實施例一格式分析結(jié)果的示意圖。
圖6為本發(fā)明實施例一模板的功能示意圖。
【主要元件符號說明】
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于緯創(chuàng)資通股份有限公司,未經(jīng)緯創(chuàng)資通股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010117010.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





