[發(fā)明專(zhuān)利]一種網(wǎng)頁(yè)生成方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201711055667.1 | 申請(qǐng)日: | 2017-11-01 |
| 公開(kāi)(公告)號(hào): | CN109753271A | 公開(kāi)(公告)日: | 2019-05-14 |
| 發(fā)明(設(shè)計(jì))人: | 溫世文 | 申請(qǐng)(專(zhuān)利權(quán))人: | 溫世文 |
| 主分類(lèi)號(hào): | G06F8/20 | 分類(lèi)號(hào): | G06F8/20;G06F21/56 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 510800 廣東省廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁(yè) 網(wǎng)頁(yè)文本 基礎(chǔ)文本 網(wǎng)頁(yè)內(nèi)容 網(wǎng)頁(yè)生成 網(wǎng)頁(yè)圖片 樣本頁(yè)面 超鏈接 腳本 鏈接 清洗 采集 網(wǎng)頁(yè)關(guān)鍵詞 操作檢測(cè) 網(wǎng)絡(luò)廣告 網(wǎng)絡(luò)監(jiān)測(cè) 網(wǎng)絡(luò)內(nèi)容 網(wǎng)頁(yè)結(jié)構(gòu) 文本對(duì)比 調(diào)取 下載 刪除 樣本 搜索 分析 后臺(tái) 病毒 儲(chǔ)存 關(guān)聯(lián) | ||
本發(fā)明涉及一種網(wǎng)頁(yè)生成方法及裝置,包括以下步驟:搜索相關(guān)網(wǎng)頁(yè),人工采集和選取多個(gè)樣本頁(yè)面進(jìn)行分析,并最終確定最接近的網(wǎng)頁(yè),然后從網(wǎng)上下載待清洗的網(wǎng)頁(yè)并儲(chǔ)存;采集樣本頁(yè)面,并對(duì)樣本頁(yè)面的網(wǎng)頁(yè)結(jié)構(gòu)進(jìn)行分析,按照網(wǎng)頁(yè)文本、網(wǎng)頁(yè)圖片、網(wǎng)頁(yè)超鏈接、腳本進(jìn)行劃分,刪除腳本;對(duì)后臺(tái)打開(kāi)的超鏈接網(wǎng)絡(luò)內(nèi)容進(jìn)行網(wǎng)絡(luò)監(jiān)測(cè),判斷是否為網(wǎng)絡(luò)廣告鏈接或病毒鏈接;對(duì)網(wǎng)頁(yè)文本進(jìn)行查看,逐一與需要的網(wǎng)頁(yè)關(guān)鍵詞進(jìn)行對(duì)比,將網(wǎng)頁(yè)內(nèi)容中有相應(yīng)的關(guān)鍵詞作為基礎(chǔ)文本,并判斷其他網(wǎng)頁(yè)文本與該基礎(chǔ)文本是否存在關(guān)聯(lián),若有,繼續(xù)對(duì)比,直至所有文本對(duì)比結(jié)束,調(diào)取網(wǎng)頁(yè)圖片并進(jìn)行判斷,最終獲得干凈的網(wǎng)頁(yè)內(nèi)容。該方法操作檢測(cè)、清洗網(wǎng)頁(yè)更干凈。
技術(shù)領(lǐng)域
本發(fā)明涉及一種互聯(lián)網(wǎng)的技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)頁(yè)生成方法及裝置。
背景技術(shù)
終端在向服務(wù)器獲取網(wǎng)頁(yè)時(shí),可以向服務(wù)器發(fā)送網(wǎng)頁(yè)獲取請(qǐng)求,服務(wù)器根據(jù)該網(wǎng)頁(yè)獲取請(qǐng)求獲取網(wǎng)頁(yè)數(shù)據(jù),根據(jù)網(wǎng)頁(yè)數(shù)據(jù)生成網(wǎng)頁(yè),將網(wǎng)頁(yè)發(fā)送給終端,終端對(duì)接收到的網(wǎng)頁(yè)進(jìn)行顯示。網(wǎng)頁(yè)通常會(huì)包括頭部、邊欄和底部,因此,開(kāi)發(fā)人員可以編輯頭部模板文件、邊欄模板文件和底部模板文件之類(lèi)的通用模板文件。在根據(jù)網(wǎng)頁(yè)數(shù)據(jù)生成網(wǎng)頁(yè)時(shí),服務(wù)器依次調(diào)用編輯的通用模板文件,將網(wǎng)頁(yè)數(shù)據(jù)分別添加到對(duì)應(yīng)的通用模板文件中,得到網(wǎng)頁(yè)。但是目前的網(wǎng)頁(yè)生成存在以下缺陷:由于服務(wù)器生成每個(gè)網(wǎng)頁(yè)時(shí)都需要處理并分析多個(gè)通用模板文件,使得服務(wù)器對(duì)文件的引用次數(shù)較多,造成代碼冗余,導(dǎo)致網(wǎng)頁(yè)生成的效率較低。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種網(wǎng)頁(yè)生成方法及裝置,它能有效的解決背景技術(shù)中存在的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種網(wǎng)頁(yè)生成方法,具體包括以下步驟:
S1、將網(wǎng)頁(yè)數(shù)據(jù)按照從上到下、從左到右的順序轉(zhuǎn)換成視圖并進(jìn)行編號(hào),然后進(jìn)行緩存;
S2、將同一編號(hào)下的視圖進(jìn)行調(diào)取發(fā)送給布局層;由布局層獲取當(dāng)前顯示器的尺寸,然后根據(jù)視圖的數(shù)量對(duì)顯示器進(jìn)行劃分區(qū)域,然后按照數(shù)據(jù)進(jìn)行縮放相應(yīng)的視圖;
S3、將文本對(duì)應(yīng)的視圖進(jìn)行OCR轉(zhuǎn)換,變成文本后按順序進(jìn)行顯示,最終得到網(wǎng)頁(yè)。
進(jìn)一步,對(duì)步驟S3中識(shí)別的文件進(jìn)行校準(zhǔn)。
進(jìn)一步,在步驟S2中對(duì)顯示屏劃分顯示區(qū)域時(shí)通過(guò)對(duì)視圖的高度、位置、內(nèi)容、寬度進(jìn)行一一測(cè)量,然后按照對(duì)應(yīng)的比例規(guī)格進(jìn)行劃分。
進(jìn)一步,在步驟S1中對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行安全監(jiān)測(cè),過(guò)濾錯(cuò)誤腳本及病毒軟件。
進(jìn)一步,在步驟S2中對(duì)顯示器的尺寸進(jìn)行測(cè)量,然后根據(jù)視圖的數(shù)量對(duì)顯示器進(jìn)行劃分區(qū)域的具體步驟如下:
S21、先獲取網(wǎng)頁(yè)顯示的顯示屏數(shù)據(jù);
S22、然后獲取共有多少了有效圖片,以及對(duì)應(yīng)試圖的大小;
S23、然后先將該顯示屏數(shù)據(jù)進(jìn)行上、下、左、右留白處理,然后將中間部分作為最終圖片顯示的位置,并根據(jù)排布的規(guī)格將圖片進(jìn)行縮放處理。
進(jìn)一步,在步驟S23中留白處理過(guò)程中的尺寸可以上下左右均一致,或者上下一致、左右一致。
本技術(shù)方案還公開(kāi)了一種網(wǎng)頁(yè)生成方法的生成裝置,其具體包括以下模塊:
網(wǎng)頁(yè)內(nèi)容獲取模塊,用于獲取網(wǎng)頁(yè)內(nèi)容;
圖片獲取模塊,用于將網(wǎng)頁(yè)數(shù)據(jù)內(nèi)容按照段落、圖片進(jìn)行圖片采集獲得對(duì)應(yīng)的圖片,然后進(jìn)行按順序進(jìn)行編號(hào);
OCR轉(zhuǎn)換模塊,用于將圖片獲取模塊中獲取的文體圖片轉(zhuǎn)換成文本形式,并按原先的順序進(jìn)行排布;
顯示器尺寸檢查模塊,用于檢測(cè)顯示器的尺寸;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于溫世文,未經(jīng)溫世文許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711055667.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種搜索網(wǎng)頁(yè)的方法和裝置
- 網(wǎng)頁(yè)類(lèi)型識(shí)別方法以及網(wǎng)頁(yè)類(lèi)型識(shí)別裝置
- 網(wǎng)頁(yè)生成方法及網(wǎng)頁(yè)生成裝置
- 網(wǎng)頁(yè)修改方法及網(wǎng)頁(yè)修改裝置
- 網(wǎng)頁(yè)訪問(wèn)處理方法
- 獲取網(wǎng)頁(yè)信息方法和裝置
- 網(wǎng)頁(yè)資源的獲取方法、裝置及終端
- 一種網(wǎng)頁(yè)制作方法、系統(tǒng)、可讀存儲(chǔ)介質(zhì)及服務(wù)器
- 網(wǎng)頁(yè)安全處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種網(wǎng)頁(yè)同步的方法、系統(tǒng)
- 一種網(wǎng)頁(yè)文本還原系統(tǒng)及方法
- 對(duì)網(wǎng)頁(yè)文本內(nèi)容進(jìn)行提取的方法和裝置
- 一種客戶(hù)端設(shè)備
- 以錨文本作為網(wǎng)頁(yè)標(biāo)題的方法和裝置
- 網(wǎng)頁(yè)文本的修改方法及裝置
- 一種基于機(jī)器學(xué)習(xí)的文本分類(lèi)方法及終端設(shè)備
- 基于機(jī)器學(xué)習(xí)的文本分類(lèi)方法及終端設(shè)備
- 相似網(wǎng)頁(yè)檢測(cè)方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種網(wǎng)頁(yè)文本相似度的計(jì)算方法和裝置
- 一種基于文本主題的網(wǎng)頁(yè)暗鏈檢測(cè)方法和裝置
- 一種容器控件的快速定位方法及系統(tǒng)
- 一種確定圖片簇描述文本核心詞的方法及裝置
- 一種基于切詞的多層次檢索方法
- 一種文本分類(lèi)模型學(xué)習(xí)方法及裝置
- 一種目標(biāo)文本確定方法、裝置及設(shè)備
- 文本識(shí)別的方法、系統(tǒng)、計(jì)算機(jī)系統(tǒng)及介質(zhì)
- 基于文本相似性分析的專(zhuān)利推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置、介質(zhì)和電子設(shè)備
- 文本處理方法、裝置、終端設(shè)備和存儲(chǔ)介質(zhì)
- 信息提取方法、閱讀理解模型訓(xùn)練方法及相關(guān)裝置
- 分享網(wǎng)頁(yè)內(nèi)容的方法及系統(tǒng)
- 網(wǎng)頁(yè)顯示方法和裝置
- 對(duì)網(wǎng)頁(yè)文本內(nèi)容進(jìn)行提取的方法和裝置
- 一種客戶(hù)端設(shè)備
- 網(wǎng)頁(yè)內(nèi)容推薦方法和網(wǎng)頁(yè)內(nèi)容推薦設(shè)備
- 網(wǎng)頁(yè)中網(wǎng)頁(yè)元素的調(diào)整方法、裝置和移動(dòng)終端
- 網(wǎng)頁(yè)內(nèi)容顯示方法及裝置
- 網(wǎng)頁(yè)內(nèi)容顯示的控制方法及裝置
- 導(dǎo)航網(wǎng)頁(yè)的檢測(cè)方法和裝置
- 一種網(wǎng)頁(yè)內(nèi)容提取的方法及裝置





