[發(fā)明專利]用戶畫像的生成方法及裝置、計算機設(shè)備及可讀介質(zhì)有效

申請?zhí)枺?/td>	201711407335.5	申請日：	2017-12-22
公開（公告）號：	CN110019837B	公開（公告）日：	2021-07-16
發(fā)明（設(shè)計）人：	沈之銳	申請（專利權(quán)）人：	百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
主分類號：	G06F16/36	分類號：	G06F16/36;G06F16/35;G06F16/34
代理公司：	北京鴻德海業(yè)知識產(chǎn)權(quán)代理有限公司 11412	代理人：	袁媛
地址：	100085 北京***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	用戶畫像生成方法裝置計算機設(shè)備可讀介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種用戶畫像的生成方法，其特征在于，所述方法包括：

當(dāng)檢測到用戶對目標(biāo)文章感興趣時，提取所述目標(biāo)文章的多個關(guān)鍵語句；

根據(jù)所述多個關(guān)鍵語句，從預(yù)先建立的知識圖譜中獲取所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點；

根據(jù)所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點和預(yù)先訓(xùn)練的用戶畫像生成模型，生成所述用戶的畫像。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，根據(jù)所述多個關(guān)鍵語句，從預(yù)先建立的知識圖譜中獲取所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點，具體包括：

計算各所述關(guān)鍵語句分別與預(yù)先建立的知識圖譜中各知識點的相似度；

根據(jù)各所述關(guān)鍵語句分別與所述知識圖譜中各知識點的相似度，篩選所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，根據(jù)各所述關(guān)鍵語句分別與所述知識圖譜中各知識點的相似度，篩選所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點，具體包括：

根據(jù)各所述關(guān)鍵語句分別與所述知識圖譜中各知識點的相似度，從所述知識圖譜的所有知識點中篩選與對應(yīng)的所述關(guān)鍵語句的相似度最大的知識點作為所述目標(biāo)知識點，得到所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點；

或者，根據(jù)各所述關(guān)鍵語句分別與所述知識圖譜中各知識點的相似度以及預(yù)設(shè)的相似度閾值，從所述知識圖譜的所有知識點中篩選與對應(yīng)的所述關(guān)鍵語句的相似度大于所述相似度閾值的知識點作為所述目標(biāo)知識點，得到所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，當(dāng)檢測到用戶對目標(biāo)文章感興趣之前，所述方法還包括：

獲取所述用戶閱讀所述目標(biāo)文章的消耗時間長度；

基于所述消耗時間長度，檢測所述用戶是否對所述目標(biāo)文章感興趣。

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，基于所述消耗時間長度，檢測所述用戶是否對所述目標(biāo)文章感興趣，具體包括：

判斷所述消耗時間長度是否大于預(yù)設(shè)的時間長度閾值，若是，確定所述用戶對所述目標(biāo)文章感興趣，否則確定所述用戶對所述目標(biāo)文章不感興趣。

6.根據(jù)權(quán)利要求4所述的方法，其特征在于，基于所述消耗時間長度，檢測所述用戶是否對所述目標(biāo)文章感興趣，具體包括：

根據(jù)所述目標(biāo)文章的長度和預(yù)設(shè)的閱讀速度，獲取所述目標(biāo)文章的標(biāo)準(zhǔn)閱讀時間長度；

根據(jù)所述標(biāo)準(zhǔn)閱讀時長和預(yù)設(shè)的興趣度比例，獲取比例閱讀時長；

判斷所述消耗時間長度是否大于或者等于所述比例閱讀時長，若是，確定所述用戶對所述目標(biāo)文章感興趣，否則確定所述用戶對所述目標(biāo)文章不感興趣。

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，根據(jù)所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點和預(yù)先訓(xùn)練的用戶畫像生成模型，生成所述用戶的畫像，具體包括：

將所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點輸入所述用戶畫像生成模型，使得所述用戶畫像生成模型預(yù)測得到所述用戶的多個特征信息，所述用戶的多個特征信息構(gòu)成所述用戶的畫像。

8.根據(jù)權(quán)利要求1所述的方法，其特征在于，根據(jù)所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點和預(yù)先訓(xùn)練的用戶畫像生成模型，生成所述用戶的畫像之前，所述方法還包括：

采集數(shù)條訓(xùn)練數(shù)據(jù)，各所述訓(xùn)練數(shù)據(jù)中包括基于所述知識圖譜從訓(xùn)練用戶閱讀的訓(xùn)練文章中獲取的多個訓(xùn)練知識點、以及所述訓(xùn)練用戶的多個已知特征信息；

根據(jù)所述數(shù)條訓(xùn)練數(shù)據(jù)，訓(xùn)練所述用戶畫像生成模型。

9.一種用戶畫像的生成裝置，其特征在于，所述裝置包括：

提取模塊，用于當(dāng)檢測到用戶對目標(biāo)文章感興趣時，提取所述目標(biāo)文章的多個關(guān)鍵語句；

獲取模塊，用于根據(jù)所述多個關(guān)鍵語句，從預(yù)先建立的知識圖譜中獲取所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點；

生成模塊，用于根據(jù)所述目標(biāo)文章對應(yīng)的多個目標(biāo)知識點和預(yù)先訓(xùn)練的用戶畫像生成模型，生成所述用戶的畫像。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司，未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711407335.5/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。