[發(fā)明專(zhuān)利]一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要的生成方法與系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201410806983.8 | 申請(qǐng)日: | 2014-12-22 |
| 公開(kāi)(公告)號(hào): | CN105786841A | 公開(kāi)(公告)日: | 2016-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 董毅;張前川;陳營(yíng)營(yíng);張川;魏文華 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100088 北京市西城區(qū)新*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 新聞 網(wǎng)頁(yè) 智能 摘要 生成 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及智能摘要技術(shù)領(lǐng)域,尤其涉及一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智 能摘要的生成方法與系統(tǒng)。
背景技術(shù)
隨著國(guó)內(nèi)互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,如何在互聯(lián)網(wǎng)上快速準(zhǔn)確的找 到自己所需要的信息,成為互聯(lián)網(wǎng)搜索中的一個(gè)關(guān)鍵問(wèn)題。
現(xiàn)有的摘要生成方法主要有兩種,一種是靜態(tài)摘要生成方法,以 文檔的主題為中心,即“全文摘要”,這種方法生成的摘要雖然很好的 表達(dá)了文檔的中心意思,但是文檔中與用戶(hù)查詢(xún)相關(guān)的信息未必是文 檔主題,該信息卻可能對(duì)用戶(hù)很有價(jià)值,故靜態(tài)摘要生成方法很難滿(mǎn) 足用戶(hù)的查詢(xún)需求;另一種是動(dòng)態(tài)摘要生成方法,根據(jù)用戶(hù)的查詢(xún)關(guān) 鍵詞,從文檔中提取與查詢(xún)關(guān)鍵詞最相關(guān)的部分,但是很多時(shí)候查詢(xún) 關(guān)鍵詞并不直接體現(xiàn)用戶(hù)的查詢(xún)需求,故動(dòng)態(tài)摘要生成方法同樣很難 滿(mǎn)足用戶(hù)的查詢(xún)需求,并且當(dāng)查詢(xún)關(guān)鍵詞分散在文檔中的多個(gè)段落 時(shí),提取出來(lái)的摘要更是很難包括用戶(hù)需要的信息。
如何提供一種生成搜索結(jié)果的摘要的方法,使得摘要能夠較好 的滿(mǎn)足用戶(hù)的查詢(xún)需求,以及包含較多的真正是用戶(hù)需要的相關(guān)信 息,成為目前急需解決的問(wèn)題之一。因此,上述搜索結(jié)果頁(yè)生成或 者顯示方法不能快速有效的為用戶(hù)提供想要的內(nèi)容。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至 少部分地解決或者減緩上述問(wèn)題的一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要的 生成方法和相應(yīng)的一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要的生成系統(tǒng)。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要的 生成方法,包括步驟:
獲取通過(guò)第三方自定義的新聞?lì)惥W(wǎng)頁(yè)頭部標(biāo)簽數(shù)據(jù),獲取所述網(wǎng) 頁(yè)對(duì)應(yīng)的新聞?lì)惤Y(jié)構(gòu)化字段;
利用所述新聞?lì)惤Y(jié)構(gòu)化字段在搜索結(jié)果列表中生成所述新聞?lì)? 網(wǎng)頁(yè)的智能摘要數(shù)據(jù)。
進(jìn)一步地,該方法在獲取通過(guò)第三方自定義的新聞?lì)惥W(wǎng)頁(yè)頭部標(biāo) 簽數(shù)據(jù)之前,還包括通過(guò)第三方在超文本文檔源代碼的頭部部分添加 以預(yù)定輔助標(biāo)簽標(biāo)識(shí)的新聞?lì)惤Y(jié)構(gòu)化字段。
進(jìn)一步地,所述步驟利用所述新聞?lì)惤Y(jié)構(gòu)化字段在搜索結(jié)果列表 中生成所述新聞?lì)惥W(wǎng)頁(yè)的智能摘要數(shù)據(jù),進(jìn)一步包括:
根據(jù)字段標(biāo)識(shí)信息從所述新聞?lì)惤Y(jié)構(gòu)化字段中識(shí)別圖片的URL 字段、新聞發(fā)明時(shí)間字段、新聞標(biāo)題字段和/或新聞?wù)侄危?
根據(jù)識(shí)別的各個(gè)字段在搜索結(jié)果列表中生成智能摘要數(shù)據(jù)。
進(jìn)一步地,所述步驟根據(jù)識(shí)別的各個(gè)字段在搜索結(jié)果列表中生成 智能摘要數(shù)據(jù),進(jìn)一步包括:
根據(jù)字段標(biāo)識(shí)信息將所述各個(gè)字段的內(nèi)容嵌入在與所述字段標(biāo) 識(shí)信息對(duì)應(yīng)的預(yù)設(shè)區(qū)域,生成智能摘要數(shù)據(jù)。
進(jìn)一步地,所述步驟通過(guò)第三方在超文本文檔源代碼的頭部部分 添加以預(yù)定輔助標(biāo)簽標(biāo)識(shí)的新聞?lì)惤Y(jié)構(gòu)化字段,進(jìn)一步包括:對(duì)所述 每個(gè)網(wǎng)頁(yè)結(jié)構(gòu)化字段中的每個(gè)字段確定重要度;
根據(jù)重要度利用所述新聞?lì)惤Y(jié)構(gòu)化字段在搜索結(jié)果列表中生成 所述新聞?lì)惥W(wǎng)頁(yè)的智能摘要數(shù)據(jù)。
進(jìn)一步地,該方法還包括:根據(jù)所述新聞?lì)惥W(wǎng)頁(yè)的智能摘要數(shù)據(jù) 在搜索結(jié)果列表中的預(yù)定區(qū)域內(nèi)顯示網(wǎng)頁(yè)智能摘要。
進(jìn)一步地,所述步驟根據(jù)所述新聞?lì)惥W(wǎng)頁(yè)的智能摘要數(shù)據(jù)在搜索 結(jié)果列表中的預(yù)定區(qū)域內(nèi)顯示網(wǎng)頁(yè)智能摘要,進(jìn)一步包括:在所述預(yù) 定區(qū)域的左側(cè)顯示圖片。
具體地,所述第三方為網(wǎng)站管理者或者網(wǎng)頁(yè)提供者。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要 的生成系統(tǒng),該系統(tǒng)包括:
新聞?lì)惤Y(jié)構(gòu)化字段獲取單元,用于通過(guò)第三方自定義的新聞?lì)惥W(wǎng) 頁(yè)頭部標(biāo)簽數(shù)據(jù),獲取所述網(wǎng)頁(yè)對(duì)應(yīng)的新聞?lì)惤Y(jié)構(gòu)化字段;
智能摘要數(shù)據(jù)生成單元,用于利用所述新聞?lì)惤Y(jié)構(gòu)化字段在搜索 結(jié)果列表中生成所述新聞?lì)惥W(wǎng)頁(yè)的智能摘要數(shù)據(jù)。
進(jìn)一步地,該系統(tǒng)還包括:新聞?lì)惤Y(jié)構(gòu)化字段添加單元,用于通 過(guò)第三方在超文本文檔源代碼的頭部部分添加以預(yù)定輔助標(biāo)簽標(biāo)識(shí) 的新聞?lì)惤Y(jié)構(gòu)化字段。
本發(fā)明的有益效果為:本發(fā)明提出的一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘 要的生成方法以及一種對(duì)新聞?lì)惖木W(wǎng)頁(yè)智能摘要的生成系統(tǒng),不僅使 得摘要內(nèi)容更結(jié)構(gòu)化的進(jìn)行展現(xiàn),做到圖文并茂,提高用戶(hù)的閱讀性, 同時(shí)還可以提高網(wǎng)頁(yè)摘要的可操作性。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410806983.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種搜索網(wǎng)頁(yè)的方法和裝置
- 網(wǎng)頁(yè)類(lèi)型識(shí)別方法以及網(wǎng)頁(yè)類(lèi)型識(shí)別裝置
- 網(wǎng)頁(yè)生成方法及網(wǎng)頁(yè)生成裝置
- 網(wǎng)頁(yè)修改方法及網(wǎng)頁(yè)修改裝置
- 網(wǎng)頁(yè)訪(fǎng)問(wèn)處理方法
- 獲取網(wǎng)頁(yè)信息方法和裝置
- 網(wǎng)頁(yè)資源的獲取方法、裝置及終端
- 一種網(wǎng)頁(yè)制作方法、系統(tǒng)、可讀存儲(chǔ)介質(zhì)及服務(wù)器
- 網(wǎng)頁(yè)安全處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種網(wǎng)頁(yè)同步的方法、系統(tǒng)





