[發(fā)明專利]一種關(guān)聯(lián)新聞的確定方法以及裝置有效
| 申請?zhí)枺?/td> | 201510974713.2 | 申請日: | 2015-12-22 |
| 公開(公告)號: | CN105653598B | 公開(公告)日: | 2019-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 張伸正;魏少俊;陳培軍 | 申請(專利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35 |
| 代理公司: | 北京市浩天知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11276 | 代理人: | 宋菲 |
| 地址: | 100088 北京市西城區(qū)新*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 關(guān)聯(lián) 新聞 確定 方法 以及 裝置 | ||
1.一種關(guān)聯(lián)新聞的確定方法,包括步驟:
選取多個(gè)新聞作為某一新聞?lì)悇e的多個(gè)標(biāo)桿新聞;
計(jì)算其他新聞與所述多個(gè)標(biāo)桿新聞之間的距離;
當(dāng)所述其他新聞與所述多個(gè)標(biāo)桿新聞之間的距離不大于設(shè)定的閾值時(shí),確定所述其他新聞為所述新聞?lì)悇e的關(guān)聯(lián)新聞;
所述設(shè)定的閾值,用于調(diào)整標(biāo)桿新聞權(quán)重,確定標(biāo)桿新聞對確定關(guān)聯(lián)新聞的作用;
對已經(jīng)確定為所述新聞?lì)悇e的新聞根據(jù)以下因素進(jìn)行排序:點(diǎn)擊率、新聞轉(zhuǎn)載率、以及評論數(shù)量,將排在前面的多個(gè)新聞作為所述多個(gè)標(biāo)桿新聞;或隨機(jī)選取M個(gè)已經(jīng)聚類的新聞,通過計(jì)算M個(gè)新聞之間的距離,按照與其他新聞M-1個(gè)新聞距離之和進(jìn)行排序,將距離短的多個(gè)新聞作為所述標(biāo)桿新聞;
對發(fā)布時(shí)間超過一定時(shí)間閾值的新聞,不選擇其作為所述標(biāo)桿新聞。
2.根據(jù)權(quán)利要求1所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述新聞包括:新聞標(biāo)題,新聞?wù)蛐侣勅摹?/p>
3.根據(jù)權(quán)利要求2所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述距離由所述其他新聞的特征向量分別與所述多個(gè)標(biāo)桿新聞的特征向量的交集確定。
4.根據(jù)權(quán)利要求3所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述距離由所述其他新聞的特征向量分別與所述多個(gè)標(biāo)桿新聞的特征向量的內(nèi)積或夾角的余弦確定。
5.根據(jù)權(quán)利要求4所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述距離由所述其他新聞的特征向量的最小哈希值與所述多個(gè)標(biāo)桿新聞的特征向量的最小哈希值確定。
6.根據(jù)權(quán)利要求5所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述特征向量的構(gòu)成具體為將新聞進(jìn)行分詞處理后形成字詞序列,根據(jù)字詞序列中字詞出現(xiàn)頻率由高到低的順序重新排列字詞順序,由前至后取出預(yù)設(shè)數(shù)量的字詞作為所述新聞的特征向量。
7.根據(jù)權(quán)利要求6所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述將新聞進(jìn)行分詞處理后進(jìn)一步進(jìn)行去無用信息處理再形成排序前的字詞序列。
8.根據(jù)權(quán)利要求7所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述當(dāng)所述其他新聞與所述多個(gè)標(biāo)桿新聞之間的距離不大于設(shè)定的閾值中的閾值均不相同或至少兩個(gè)不相同。
9.根據(jù)權(quán)利要求7所述的關(guān)聯(lián)新聞的確定方法,其特征在于,所述當(dāng)所述其他新聞與所述多個(gè)標(biāo)桿新聞之間的距離不大于設(shè)定的閾值中的閾值是相同的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510974713.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





