[發(fā)明專利]一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010540941.X | 申請(qǐng)日: | 2020-06-15 |
| 公開(公告)號(hào): | CN111723262A | 公開(公告)日: | 2020-09-29 |
| 發(fā)明(設(shè)計(jì))人: | 王世偉 | 申請(qǐng)(專利權(quán))人: | 武漢文慧谷信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/951 | 分類號(hào): | G06F16/951;G06F16/9535;G06F16/34;G06F16/33 |
| 代理公司: | 武漢聚信匯智知識(shí)產(chǎn)權(quán)代理有限公司 42258 | 代理人: | 馬尚偉 |
| 地址: | 430000 湖北省武漢*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 批量 合并 網(wǎng)絡(luò) 新聞標(biāo)題 摘要 正文 系統(tǒng) 方法 | ||
一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng)和方法,涉及文檔合并技術(shù)領(lǐng)域,包括獲取模塊、數(shù)據(jù)處理模塊、數(shù)據(jù)庫、數(shù)據(jù)查詢模塊和客戶端,通過獲取模塊進(jìn)行在線新聞采集,數(shù)據(jù)處理模塊對(duì)新聞數(shù)據(jù)進(jìn)行處理,可以用一個(gè)頁面讓讀者看到某大型網(wǎng)站當(dāng)天發(fā)布的幾千條新聞的標(biāo)題,并可對(duì)悅心的文章在線瀏覽,通過對(duì)新聞?wù)纳膳c合并,可以用一個(gè)頁面讓讀者看到某個(gè)專題幾百篇文章的摘要,通過對(duì)新聞?wù)牡暮喜ⅲ梢杂靡粋€(gè)頁面讓讀者看到某個(gè)專題幾十篇文章的正文,管理員可以根據(jù)整理之后的新聞,選擇優(yōu)質(zhì)內(nèi)容,進(jìn)行發(fā)布到前臺(tái),用戶通過客戶端訪問系統(tǒng)并在看到感興趣的內(nèi)容時(shí),快速的打開詳細(xì)地址,查閱詳細(xì)內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明涉及文檔合并技術(shù)領(lǐng)域,具體涉及一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng)和方法。
背景技術(shù)
由于互聯(lián)網(wǎng)的發(fā)展,我們現(xiàn)在正處在一個(gè)信息大爆炸的時(shí)代,國(guó)家級(jí)、省市級(jí)、地市級(jí)、行業(yè)、專業(yè)等各級(jí)各類網(wǎng)站每天都產(chǎn)生大量信息,于是乎我們每天要進(jìn)行反復(fù)的如下操作:打開網(wǎng)站,找到相關(guān)欄目,點(diǎn)開文章鏈接,閱讀文章,再點(diǎn)開下一篇文章;然后,退出這個(gè)網(wǎng)站,繼續(xù)前面的操作,閱讀下一個(gè)網(wǎng)站;重要新聞網(wǎng)站閱讀完畢之后,再打開專業(yè)網(wǎng)站,繼續(xù)點(diǎn)來點(diǎn)去,新聞信息不能集中進(jìn)行合并閱讀,查找閱讀新聞的過程中時(shí)間被大量的浪費(fèi),導(dǎo)致閱讀效率低下,不能快速篩選和獲取我們所需要的知識(shí)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng)和方法,通過對(duì)新聞標(biāo)題的合并,可以用一個(gè)頁面讓讀者看到某大型網(wǎng)站當(dāng)天發(fā)布的幾千條新聞的標(biāo)題,并可對(duì)悅心的文章在線瀏覽;通過摘要的生成與合并,可以用一個(gè)頁面讓讀者看到某個(gè)專題幾百篇文章的摘要;通過正文是合并,可以用一個(gè)頁面讓讀者看到某個(gè)專題幾十篇文章的正文,節(jié)省了大量的查找和篩選的時(shí)間,解決了目前新聞閱讀存在的新聞信息不能集中進(jìn)行合并閱讀,查找閱讀新聞的過程中時(shí)間被大量的浪費(fèi),導(dǎo)致閱讀效率低下,不能快速篩選和獲取我們所需要的知識(shí)的問題。
鑒于上述問題,提出了本發(fā)明以便提供一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng)通過對(duì)采集的新聞進(jìn)行處理和合并進(jìn)行發(fā)布,用戶通過瀏覽一個(gè)頁面可以看到某個(gè)專題幾十篇文章的正文,解決了目前新聞閱讀存在的新聞信息不能集中進(jìn)行合并閱讀,查找閱讀新聞的過程中時(shí)間被大量的浪費(fèi),導(dǎo)致閱讀效率低下,不能快速篩選和獲取我們所需要的知識(shí)的問題。
一種批量合并網(wǎng)絡(luò)新聞標(biāo)題、摘要、正文的系統(tǒng),包括:獲取模塊,數(shù)據(jù)處理模塊,數(shù)據(jù)庫,數(shù)據(jù)查詢模塊和客戶端;
獲取模塊,用于采集各種新聞數(shù)據(jù),并將采集到的新聞數(shù)據(jù)傳輸?shù)綌?shù)據(jù)處理模塊;
數(shù)據(jù)處理模塊,用于接收獲取模塊傳輸?shù)男侣剶?shù)據(jù),并對(duì)新聞數(shù)據(jù)進(jìn)行處理并將處理后的新聞數(shù)據(jù)傳輸?shù)綌?shù)據(jù)庫;
數(shù)據(jù)庫,用于接收數(shù)據(jù)處理模塊傳輸?shù)男侣剶?shù)據(jù)并對(duì)新聞數(shù)據(jù)就那些存儲(chǔ);
數(shù)據(jù)查詢模塊,用于查詢數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)并反饋到客戶端;
客戶端,用于發(fā)送控制指令到數(shù)據(jù)查詢模塊對(duì)數(shù)據(jù)庫進(jìn)行查詢操作。
進(jìn)一步的,所述獲取模塊包括采集器,所述采集器采集的數(shù)據(jù)包括各大平臺(tái)免費(fèi)新聞以及訪問地址;
進(jìn)一步的,數(shù)據(jù)處理模塊包括數(shù)據(jù)清洗單元、數(shù)據(jù)合并單元、數(shù)據(jù)索引單元和數(shù)據(jù)發(fā)布單元,所述數(shù)據(jù)清洗單元用于新聞數(shù)據(jù)的數(shù)據(jù)、欄目信息補(bǔ)充、異常數(shù)據(jù)過濾、數(shù)據(jù)去重以及錯(cuò)誤數(shù)據(jù)收集,所述數(shù)據(jù)合并單元用于新聞數(shù)據(jù)合并,包括標(biāo)題合并、正文合并和摘要合并,所述數(shù)據(jù)索引單元用于管理新聞數(shù)據(jù),包括全量數(shù)據(jù)索引、增量數(shù)據(jù)索引、修改數(shù)據(jù)索引更新和刪除新聞索引同步,所述數(shù)據(jù)發(fā)布單元用于發(fā)布新聞數(shù)據(jù),包括首頁新聞推薦、分欄目新聞閱讀、新聞簡(jiǎn)報(bào)查看、新聞詳情參考和新聞源地址查看。
進(jìn)一步的,所述數(shù)據(jù)查詢模塊包括查詢單元、緩存單元和反饋單元,所述查詢單元用于在系統(tǒng)和數(shù)據(jù)庫中進(jìn)行新聞數(shù)據(jù)的查詢,所述緩存單元用于緩存歷史查詢記錄形成快速訪問接口,所述反饋單元用于反饋查詢結(jié)果數(shù)據(jù)到客戶端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢文慧谷信息技術(shù)有限公司,未經(jīng)武漢文慧谷信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010540941.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





