[發(fā)明專利]一種搜索摘要生成方法及裝置在審
| 申請?zhí)枺?/td> | 201611070196.7 | 申請日: | 2016-11-28 |
| 公開(公告)號: | CN106776860A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 聶鵬宇;石曉巍 | 申請(專利權(quán))人: | 北京三快在線科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11371 | 代理人: | 凌趙華 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 摘要 生成 方法 裝置 | ||
1.一種搜索摘要生成方法,其特征在于,所述方法包括:
獲取根據(jù)用戶輸入的查詢詞進行檢索得到的與所述查詢詞相關(guān)的目標(biāo)網(wǎng)址;
獲取所述用戶的用戶畫像,所述用戶畫像用于描述所述用戶的搜索習(xí)慣、搜索偏好、搜索頻率、消費習(xí)慣、搜索關(guān)注點中的至少一種;
根據(jù)所述查詢詞和所述用戶畫像生成所述目標(biāo)網(wǎng)址對應(yīng)的搜索摘要;
展示各個所述目標(biāo)網(wǎng)址對應(yīng)的所述搜索摘要。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述用戶的用戶畫像之前,還包括:
獲取所述用戶的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括用戶基本信息、歷史登陸信息、歷史搜索記錄、歷史瀏覽記錄、歷史收藏記錄、歷史下載記錄、歷史評論記錄和歷史消費記錄中的至少一種;和/或,
獲取所述用戶當(dāng)前搜索行為的上下文信息,所述上下文信息包括當(dāng)前時間、當(dāng)前地點、當(dāng)前環(huán)境、所述用戶最近搜索的詞語、所述用戶最近瀏覽的網(wǎng)頁中的至少一種;
根據(jù)所述用戶的歷史行為數(shù)據(jù)和/或所述上下文信息建立所述用戶的用戶畫像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述查詢詞和所述用戶畫像生成所述目標(biāo)網(wǎng)址對應(yīng)的搜索摘要,包括:
根據(jù)所述查詢詞,在所述目標(biāo)網(wǎng)址對應(yīng)的網(wǎng)頁中的文檔中提取出多個候選摘要句;
設(shè)置所述用戶畫像中各個特征標(biāo)簽的權(quán)重值;
按照候選摘要句與用戶畫像關(guān)聯(lián)度由高到低的順序根據(jù)各個特征標(biāo)簽的所述權(quán)重值對多個所述候選摘要句進行排序;
選取排序靠前的預(yù)設(shè)數(shù)量的所述候選摘要句生成所述目標(biāo)網(wǎng)址相應(yīng)的搜索摘要。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述查詢詞,在所述目標(biāo)網(wǎng)址對應(yīng)的網(wǎng)頁中的文檔中提取出多個候選摘要句,包括:
對所述目標(biāo)網(wǎng)址對應(yīng)的網(wǎng)頁中的文檔進行分詞;
將所述查詢詞與分詞后的所述文檔進行匹配,計算出所述查詢詞在所述文檔中出現(xiàn)的位置;以及將所述查詢詞的近義詞與分詞后的所述文檔進行匹配,計算出所述查詢詞的近義詞在所述文檔中出現(xiàn)的位置;
在所述文檔中,以所述查詢詞出現(xiàn)的位置和所述查詢詞的近義詞出現(xiàn)的位置為基準(zhǔn),截取多個候選摘要句。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述設(shè)置所述用戶畫像中各個特征標(biāo)簽的權(quán)重值,包括:
計算用戶歷史上對所述用戶畫像中每個所述特征標(biāo)簽的操作集中度;
根據(jù)所述操作集中度確定各個所述特征標(biāo)簽的權(quán)重值。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述按照候選摘要句與用戶畫像關(guān)聯(lián)度由高到低的順序根據(jù)各個特征標(biāo)簽的所述權(quán)重值對多個所述候選摘要句進行排序,包括:
采用邏輯回歸模型或者梯度提升樹模型按照候選摘要句與用戶畫像關(guān)聯(lián)度由高到低的順序根據(jù)各個特征標(biāo)簽的所述權(quán)重值對多個所述候選摘要句進行排序。
7.一種搜索摘要生成裝置,其特征在于,所述裝置包括:
目標(biāo)網(wǎng)址獲取模塊,用于獲取根據(jù)用戶輸入的查詢詞進行檢索得到的與所述查詢詞相關(guān)的目標(biāo)網(wǎng)址;
用戶畫像獲取模塊,用于獲取所述用戶的用戶畫像,所述用戶畫像用于描述所述用戶的搜索習(xí)慣、搜索偏好、搜索頻率、消費習(xí)慣、搜索關(guān)注點中的至少一種;
搜索摘要生成模塊,用于根據(jù)所述查詢詞和所述用戶畫像生成所述目標(biāo)網(wǎng)址對應(yīng)的搜索摘要。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
歷史行為數(shù)據(jù)獲取模塊,用于獲取所述用戶的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括用戶基本信息、歷史登陸信息、歷史搜索記錄、歷史瀏覽記錄、歷史收藏記錄、歷史下載記錄、歷史評論記錄和歷史消費記錄中的至少一種;和/或,
上下文信息獲取模塊,用于獲取所述用戶當(dāng)前搜索行為的上下文信息,所述上下文信息包括當(dāng)前時間、當(dāng)前地點、當(dāng)前環(huán)境、所述用戶最近搜索的詞語、所述用戶最近瀏覽的網(wǎng)頁中的至少一種;
用戶畫像建立模塊,用于根據(jù)所述用戶的歷史行為數(shù)據(jù)和/或所述上下文信息建立所述用戶的用戶畫像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三快在線科技有限公司,未經(jīng)北京三快在線科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611070196.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





