[發(fā)明專利]網(wǎng)頁發(fā)布時(shí)間抽取方法和用于網(wǎng)頁發(fā)布時(shí)間抽取的裝置有效
| 申請?zhí)枺?/td> | 201510955640.2 | 申請日: | 2015-12-18 |
| 公開(公告)號: | CN106897287B | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 丁圣勇;黃志蘭;樊勇兵;陳楠;金華敏;賴培源;區(qū)洪輝 | 申請(專利權(quán))人: | 中國電信股份有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會(huì)專利商標(biāo)事務(wù)所 11038 | 代理人: | 許蓓 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 發(fā)布 時(shí)間 抽取 方法 用于 裝置 | ||
1.一種網(wǎng)頁發(fā)布時(shí)間抽取方法,其特征在于,包括:
建立網(wǎng)頁源碼的文檔對象模型DOM樹;
在所述DOM樹中確定網(wǎng)頁標(biāo)題節(jié)點(diǎn),包括:根據(jù)網(wǎng)頁標(biāo)題所在的標(biāo)簽類型、唯一編碼屬性或者類屬性在所述DOM樹中確定網(wǎng)頁標(biāo)題節(jié)點(diǎn);
根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間,包括:如果在網(wǎng)頁標(biāo)題節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下有時(shí)間節(jié)點(diǎn),將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
如果在網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下有時(shí)間葉子節(jié)點(diǎn),將時(shí)間葉子節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間;
或者,
如果在網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下有時(shí)間所在的標(biāo)簽,從時(shí)間所在的標(biāo)簽中提取時(shí)間信息并作為網(wǎng)頁發(fā)布時(shí)間。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間包括:
確定網(wǎng)頁標(biāo)題節(jié)點(diǎn)的父節(jié)點(diǎn)的次左子節(jié)點(diǎn),如果次左子節(jié)點(diǎn)的若干子樹下的左子樹節(jié)點(diǎn)是時(shí)間節(jié)點(diǎn),將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間包括:
如果在網(wǎng)頁標(biāo)題節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下有時(shí)間節(jié)點(diǎn),將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間;
如果在網(wǎng)頁標(biāo)題節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下沒有時(shí)間節(jié)點(diǎn),確定網(wǎng)頁標(biāo)題節(jié)點(diǎn)的父節(jié)點(diǎn)的次左子節(jié)點(diǎn),如果次左子節(jié)點(diǎn)的若干子樹下的左子樹節(jié)點(diǎn)是時(shí)間節(jié)點(diǎn),將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間包括:
如果在網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下有時(shí)間葉子節(jié)點(diǎn),將時(shí)間葉子節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間;
如果在網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下沒有時(shí)間葉子節(jié)點(diǎn),在網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下查找是否有時(shí)間所在的標(biāo)簽,如果有,從時(shí)間所在的標(biāo)簽中提取時(shí)間信息并作為網(wǎng)頁發(fā)布時(shí)間;
如果網(wǎng)頁標(biāo)題所在的標(biāo)簽對應(yīng)的節(jié)點(diǎn)所屬的父節(jié)點(diǎn)沒有時(shí)間所在的標(biāo)簽,確定網(wǎng)頁標(biāo)題節(jié)點(diǎn)的父節(jié)點(diǎn)的次左子節(jié)點(diǎn),如果次左子節(jié)點(diǎn)的若干子樹下的左子樹節(jié)點(diǎn)是時(shí)間節(jié)點(diǎn),將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間包括:
在DOM樹中查找時(shí)間節(jié)點(diǎn),判斷查找到的時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)是否符合網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系,將符合條件的時(shí)間節(jié)點(diǎn)確定為網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn),并從網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)中提取網(wǎng)頁發(fā)布時(shí)間。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括:
如果符合條件的時(shí)間節(jié)點(diǎn)有多個(gè),將離DOM樹的根節(jié)點(diǎn)近的符合條件的時(shí)間節(jié)點(diǎn)確定為網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)。
8.一種用于網(wǎng)頁發(fā)布時(shí)間抽取的裝置,其特征在于,包括:
文檔對象模型DOM樹建立模塊,用于建立網(wǎng)頁源碼的DOM樹;
標(biāo)題節(jié)點(diǎn)確定模塊,用于在所述DOM樹中確定網(wǎng)頁標(biāo)題節(jié)點(diǎn),包括:根據(jù)網(wǎng)頁標(biāo)題所在的標(biāo)簽類型、唯一編碼屬性或者類屬性在所述DOM樹中確定網(wǎng)頁標(biāo)題節(jié)點(diǎn);
發(fā)布時(shí)間確定模塊,用于根據(jù)網(wǎng)頁發(fā)布時(shí)間節(jié)點(diǎn)與網(wǎng)頁標(biāo)題節(jié)點(diǎn)在DOM樹中的相對位置關(guān)系確定網(wǎng)頁發(fā)布時(shí)間;其中,所述發(fā)布時(shí)間確定模塊包括第一時(shí)間節(jié)點(diǎn)查找單元和第一時(shí)間信息提取單元;所述第一時(shí)間節(jié)點(diǎn)查找單元用于查找在網(wǎng)頁標(biāo)題節(jié)點(diǎn)所屬的父節(jié)點(diǎn)下是否有時(shí)間節(jié)點(diǎn),如果有,所述第一時(shí)間信息提取單元用于將時(shí)間節(jié)點(diǎn)中的時(shí)間信息提取為網(wǎng)頁發(fā)布時(shí)間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510955640.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種夾持機(jī)構(gòu)
- 下一篇:一種攝影穩(wěn)定器
- 將發(fā)布數(shù)據(jù)發(fā)布至不同發(fā)布主機(jī)的系統(tǒng)及其方法
- 一種技術(shù)出版物內(nèi)容發(fā)布系統(tǒng)及方法
- 音/視頻流發(fā)布方法、流媒體服務(wù)器、發(fā)布端及流媒體系統(tǒng)
- 一種分布式代碼版本發(fā)布系統(tǒng)及方法
- 內(nèi)容發(fā)布方法、裝置、計(jì)算機(jī)設(shè)備以及可讀存儲介質(zhì)
- 文件發(fā)布方法和系統(tǒng)、發(fā)布服務(wù)器和文件生成裝置
- 軟件的發(fā)布質(zhì)量管理系統(tǒng)、方法以及裝置
- 信息發(fā)布方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 信息發(fā)布方法及裝置、存儲介質(zhì)、終端
- 服務(wù)發(fā)布方法及裝置、服務(wù)器、存儲介質(zhì)
- 時(shí)間同步裝置、時(shí)間同步系統(tǒng)和時(shí)間同步方法
- 時(shí)間校準(zhǔn)裝置和時(shí)間校準(zhǔn)方法
- 時(shí)間同步系統(tǒng)及時(shí)間同步方法
- 時(shí)間同步方法、時(shí)間同步系統(tǒng)、時(shí)間主設(shè)備以及時(shí)間從設(shè)備
- 時(shí)間控制裝置和時(shí)間控制方法
- 時(shí)間測試電路及時(shí)間測試方法
- 時(shí)間的飛行時(shí)間
- 局部激活時(shí)間的時(shí)間變換
- 時(shí)間測量電路、時(shí)間測量芯片及時(shí)間測量裝置
- 時(shí)間同步方法與時(shí)間同步系統(tǒng)





