[發(fā)明專利]生成待推送信息的方法和裝置在審
| 申請?zhí)枺?/td> | 201710293331.2 | 申請日: | 2017-04-28 |
| 公開(公告)號: | CN108804448A | 公開(公告)日: | 2018-11-13 |
| 發(fā)明(設(shè)計)人: | 江志敏;王修飛;陳敏;韓聰;賀登武;王魯光 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 推送 推送信息 圖片素材 素材 方法和裝置 核心詞 圖片生成 信息推送 自動生成 預(yù)設(shè) 圖片 申請 優(yōu)化 | ||
本申請公開了生成待推送信息的方法和裝置。該方法的一具體實施方式包括:獲取推送素材,其中,推送素材包括文字素材和圖片素材;從上述文字素材提取核心詞,并基于所提取的核心詞確定待推送標(biāo)題;依據(jù)上述圖片素材與預(yù)設(shè)的待推送信息關(guān)鍵詞的相關(guān)性,從上述圖片素材中確定出作為待推送圖片的圖片;基于上述待推送標(biāo)題和上述待推送圖片生成待推送信息。該實施方式可以對待推送信息自動生成或優(yōu)化,進(jìn)而提高信息推送的有效性。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及生成待推送信息的方法和裝置。
背景技術(shù)
生成待推送信息,又稱為“網(wǎng)絡(luò)廣播”,是通過一定的技術(shù)標(biāo)準(zhǔn)或協(xié)議,在互聯(lián)網(wǎng)上通過推送用戶需要的信息來減少信息過載的一項技術(shù)。生成待推送信息技術(shù)通過主動選擇待推送生成待推送信息給用戶,有效的待推送信息可以減少用戶在網(wǎng)絡(luò)上搜索所花的時間。
然而,現(xiàn)有的待推送信息通常是人為設(shè)定的,人為因素影響較大,質(zhì)量參差不齊,影響信息推送的有效性。而人工審核和優(yōu)化待推送信息,工作量大。因此,需要充分利用數(shù)據(jù)處理技術(shù),生成待推送信息,提高信息推送的有效性。
發(fā)明內(nèi)容
本申請的目的在于提出一種改進(jìn)的生成待推送信息的方法和裝置,來解決以上背景技術(shù)部分提到的技術(shù)問題。
第一方面,本申請?zhí)峁┝艘环N生成待推送信息的方法,該方法包括:獲取推送素材,其中,推送素材包括文字素材和圖片素材;從上述文字素材提取核心詞,并基于所提取的核心詞確定待推送標(biāo)題;依據(jù)上述圖片素材與預(yù)設(shè)的待推送信息關(guān)鍵詞的相關(guān)性,從上述圖片素材中確定出作為待推送圖片的圖片;基于上述待推送標(biāo)題和上述待推送圖片生成待推送信息。
在一些實施例中,從上述文字素材提取核心詞,并基于所提取的核心詞確定待推送標(biāo)題包括:從上述文字素材提取核心詞,并判斷該核心詞與預(yù)設(shè)的待推送信息關(guān)鍵詞的關(guān)聯(lián)度是否大于預(yù)設(shè)關(guān)聯(lián)度閾值;若是,根據(jù)所提取的核心詞生成待推送標(biāo)題;否則,根據(jù)預(yù)設(shè)標(biāo)題生成待推送標(biāo)題。
在一些實施例中,依據(jù)對上述圖片素材與預(yù)設(shè)的待推送信息關(guān)鍵詞的相關(guān)性的計算,從上述圖片素材中確定出作為待推送圖片的圖片包括:對上述圖片素材中的圖片元素進(jìn)行識別;根據(jù)所識別的圖片元素對上述圖片素材進(jìn)行裁剪得到待選圖片;計算待選圖片中的圖片元素與預(yù)設(shè)的待推送信息關(guān)鍵詞的關(guān)聯(lián)度;選擇包含與預(yù)設(shè)的待推送信息關(guān)鍵詞的關(guān)聯(lián)度最大的圖片元素的待選圖片作為待推送圖片。
在一些實施例中,根據(jù)所識別的圖片元素對上述圖片素材進(jìn)行裁剪得到待選圖片包括:獲取圖片素材中預(yù)設(shè)圖片元素的輪廓;按照與輪廓線的預(yù)設(shè)距離從上述圖片素材裁剪出預(yù)設(shè)圖片元素作為待選圖片。
在一些實施例中,對上述圖片素材中的圖片元素進(jìn)行識別之后還包括:對每個圖片素材:判斷預(yù)設(shè)圖片元素與其他圖片元素是否有重疊;若是,響應(yīng)于重疊部分占預(yù)設(shè)圖片元素的比例超過預(yù)設(shè)比例閾值,篩除該圖片素材。
第二方面,本申請還提供了一種生成待推送信息的裝置,該裝置包括:獲取模塊,配置用于獲取推送素材,其中,推送素材包括文字素材和圖片素材;標(biāo)題確定模塊,配置用于從上述文字素材提取核心詞,并基于所提取的核心詞確定待推送標(biāo)題;圖片確定模塊,配置用于依據(jù)上述圖片素材與預(yù)設(shè)的待推送信息關(guān)鍵詞的相關(guān)性,從上述圖片素材中確定出作為待推送圖片的圖片;生成模塊,配置用于基于上述待推送標(biāo)題和上述待推送圖片生成待推送信息。
在一些實施例中,標(biāo)題確定模塊還配置用于:從上述文字素材提取核心詞,并判斷該核心詞與預(yù)設(shè)的待推送信息關(guān)鍵詞的關(guān)聯(lián)度是否大于預(yù)設(shè)關(guān)聯(lián)度閾值;若是,根據(jù)所提取的核心詞生成待推送標(biāo)題;否則,根據(jù)預(yù)設(shè)標(biāo)題生成待推送標(biāo)題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710293331.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





