[發明專利]一種新聞搜索方法及裝置在審
| 申請號: | 201710156968.7 | 申請日: | 2017-03-16 |
| 公開(公告)號: | CN106940723A | 公開(公告)日: | 2017-07-11 |
| 發明(設計)人: | 曹雪倩;安倩 | 申請(專利權)人: | 北京搜狐新媒體信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 王寶筠 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 新聞 搜索 方法 裝置 | ||
技術領域
本申請涉及電子信息領域,尤其涉及一種新聞搜索方法及裝置。
背景技術
與傳統的網頁檢索不同,新聞搜索目前還沒有完整通用的算法和模型。目前,對于新聞的搜索,主要基于PageRank算法,該算法的基本思想是:頁面的重要程度用PageRank值來衡量。PageRank值主要體現在兩個方面:引用該頁面的頁面個數和引用該頁面的頁面重要程度。一個頁面P(A)被另一個頁面P(B)引用,可看成P(B)推薦P(A),P(B)將其重要程度(PageRank值)平均的分配P(B)所引用的所有頁面,所以越多頁面引用P(A),則越多的頁面分配PageRank值給P(A),PageRank值也就越高,P(A)越重要。另外,P(B)越重要,它所引用的頁面能分配到的PageRank值就越多,P(A)的PageRank值也就越高,也就越重要。
然而,基于PageRank算法的新聞搜索方法,僅依靠被引用的次數和與引用頁面的重要程度篩選,而忽略了新聞的相關程度,以至于一些主題不相關的網頁(如廣告頁面)獲得較大的PageRank值,從而影響了搜索結果的準確性。
發明內容
本申請提供了一種新聞搜索方法及裝置,目的在于解決如何提高新聞的搜索準確性的問題。
為了實現上述目的,本申請提供了以下技術方案:
一種新聞搜索方法,包括:
依據搜索關鍵詞,得到與所述搜索關鍵詞相關的候選項;
依據新聞的屬性,確定所述候選項的屬性分,并依據所述屬性分對所述候選項排序,所述新聞的屬性包括新聞的點擊曝光率和新聞的實效周期;
按照排序結果,展示搜索結果。
可選的,所述新聞的屬性還包括:
新聞的媒體分數、被操作的次數以及被閱讀的時長中的至少一項。
可選的,所述依據新聞的屬性,確定所述候選項的屬性分包括:
確定新聞經過平滑和時間衰減后的點擊曝光率;
確定新聞的時間衰減分數,所述時間衰減分數用于表示所述新聞的實效周期;
獲取所述新聞的媒體分數、被操作的次數以及被閱讀的時長;
依據所述新聞經過平滑和時間衰減后的點擊曝光率、所述新聞的時間衰減分數、所述新聞的媒體分數、被操作的次數以及被閱讀的時長,計算所述候選項的分數。
可選的,所述確定新聞經過平滑和時間衰減后的點擊曝光率包括:
新聞經過平滑和時間衰減后的點擊率為其中,d為衰減系數,start為該新聞生成的起始時間,t表示當前時刻,dt-start-1為衰減幅度,clickt為t時刻的點擊次數;
新聞經過平滑和時間衰減后的曝光率為其中,impt為t時刻的曝光次數。
可選的,所述依據所述新聞經過平滑和時間衰減后的點擊曝光率、所述新聞的時間衰減分數、所述新聞的媒體分數、被操作的次數以及被閱讀的時長,計算所述候選項的分數包括:
使用score=smoothScore*ruleScore*div+log2(1+share)+log2(1+comment)+log2(1+collection)+log2(1+praise)+readTime計算所述候選項中的任意一項的分數,其中,smoothScore表示所述該新聞經過平滑和時間衰減后的點擊曝光率,div為該新聞的時間衰減分數,readTime為平滑后的該新聞的被閱讀時長,share為該新聞的分享數,comment該新聞的評論數,collection為該新聞的收藏數,praise為該新聞的點贊數。
可選的,所述平滑后的該新聞的被閱讀時長的確定方法包括:
其中,allReadTime為該新聞被所有用戶所閱讀的總時長,allClick為該新聞所有的點擊次數,pReadTime為該新聞虛擬的閱讀時長,pClick為該新聞虛擬的點擊次數。
可選的,在所述按照排序結果,展示搜索結果之前,還包括:
依據質量參數,確定所述排序結果中的各個候選項的質量分,所述質量參數包括新聞的長度、段落數、包括的圖片以及標題的長度;
將所述候選項中的任意一項的質量分與該項的屬性分相乘,得到總分;
依據所述候選項中每一項的總分,對所述候選項進行重排序,得到更新的排序結果。
一種新聞的搜索裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狐新媒體信息技術有限公司,未經北京搜狐新媒體信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710156968.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種太陽能電池片導線的導向輥
- 下一篇:節能燈打膠機





