[發(fā)明專利]用戶興趣識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201710749088.0 | 申請(qǐng)日: | 2017-08-25 |
| 公開(公告)號(hào): | CN107391760B | 公開(公告)日: | 2018-05-25 |
| 發(fā)明(設(shè)計(jì))人: | 王健宗;黃章成;吳天博;肖京 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27;G06K9/62;G06Q30/02 |
| 代理公司: | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國(guó) |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 訓(xùn)練樣本 測(cè)試樣本 文本數(shù)據(jù) 用戶興趣 最優(yōu)模型 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 邏輯回歸模型 預(yù)設(shè)算法 主題分類 可識(shí)別用戶 迭代算法 回歸模型 計(jì)算邏輯 潛在客戶 人工標(biāo)注 識(shí)別裝置 準(zhǔn)確定位 話題 幫助 | ||
1.一種用戶興趣識(shí)別方法,其特征在于,所述用戶興趣識(shí)別方法包括以下步驟:
獲取訓(xùn)練樣本和測(cè)試樣本,其中,所述訓(xùn)練樣本為根據(jù)文本數(shù)據(jù)訓(xùn)練出對(duì)應(yīng)的話題模型后經(jīng)過(guò)人工標(biāo)注獲得的;
利用第一預(yù)設(shè)算法分別提取所述訓(xùn)練樣本和所述測(cè)試樣本的特征,并根據(jù)所述訓(xùn)練樣本的特征,通過(guò)迭代算法計(jì)算出邏輯回歸模型的最優(yōu)模型參數(shù),訓(xùn)練出含最優(yōu)模型參數(shù)的邏輯回歸模型;
根據(jù)所述測(cè)試樣本的特征和所述含最優(yōu)模型參數(shù)的邏輯回歸模型繪制受試者工作特征ROC曲線,并根據(jù)ROC曲線下面積AUC對(duì)所述含最優(yōu)模型參數(shù)的邏輯回歸模型進(jìn)行評(píng)價(jià),訓(xùn)練出第一主題分類器;
利用所述第一主題分類器對(duì)所述文本數(shù)據(jù)進(jìn)行分類,確定所述文本數(shù)據(jù)所屬的主題,并根據(jù)所述含最優(yōu)模型參數(shù)的邏輯回歸模型計(jì)算所述文本數(shù)據(jù)所屬主題的得分;
根據(jù)所述得分和第二預(yù)設(shè)算法計(jì)算撰寫所述文本數(shù)據(jù)的用戶對(duì)所述主題感興趣的信心分,根據(jù)所述信心分識(shí)別所述用戶的興趣;
其中,所述第一預(yù)設(shè)算法為字節(jié)4元語(yǔ)法Byte 4-gram算法;
所述第二預(yù)設(shè)算法的計(jì)算公式為:
其中,TN
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710749088.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種化學(xué)發(fā)光免疫分析儀檢驗(yàn)數(shù)據(jù)查詢裝置及其查詢方法
- 下一篇:一種基于重復(fù)數(shù)據(jù)刪除技術(shù)的數(shù)據(jù)管理方法及裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種分類器的構(gòu)建方法
- 一種性別分類網(wǎng)絡(luò)訓(xùn)練方法、性別分類方法及相關(guān)裝置
- 人臉識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 機(jī)器識(shí)別模型的訓(xùn)練及機(jī)器識(shí)別方法、裝置、電子設(shè)備
- 訓(xùn)練樣本保存方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 信息處理方法、推薦方法及相關(guān)設(shè)備
- 訓(xùn)練樣本篩選方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本語(yǔ)料的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像處理模型、機(jī)器學(xué)習(xí)模型的訓(xùn)練方法及裝置
- 預(yù)測(cè)模型訓(xùn)練、數(shù)據(jù)預(yù)測(cè)方法、裝置和存儲(chǔ)介質(zhì)
- 具有圖像顯示修正機(jī)制的顯示系統(tǒng)及其操作方法
- 提高自由空間法測(cè)試能力的系統(tǒng)
- 超聲探頭適配器、超聲測(cè)試方法以及超聲測(cè)試系統(tǒng)
- 一種測(cè)試方法、裝置及系統(tǒng)
- 圖像重建方法、裝置和計(jì)算機(jī)設(shè)備
- 審核監(jiān)控方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 獲取測(cè)試樣本的方法及裝置
- 確定智能量測(cè)設(shè)備材料的力學(xué)性能的相關(guān)性的方法及系統(tǒng)
- 一種樣本分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種測(cè)試樣本生成方法和裝置
- 一種韻律預(yù)測(cè)方法及系統(tǒng)
- 一種基于KNN技術(shù)的語(yǔ)料庫(kù)文本分類方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲(chǔ)介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于包括在興趣云中的興趣標(biāo)簽選擇內(nèi)容
- 一種基于推薦的興趣社區(qū)用戶引導(dǎo)方法
- 一種全局興趣探索推薦方法和裝置
- 一種用戶興趣確定方法及裝置
- 一種實(shí)時(shí)用戶興趣識(shí)別方法及裝置
- 一種基于社交網(wǎng)絡(luò)的用戶興趣標(biāo)簽構(gòu)建方法及相關(guān)設(shè)備
- 用戶關(guān)系興趣特征圖的獲取方法、裝置、設(shè)備及介質(zhì)
- 一種個(gè)性化興趣點(diǎn)推薦方法及系統(tǒng)
- 一種基于圖嵌入與用戶長(zhǎng)短期興趣融合的興趣點(diǎn)推薦方法、系統(tǒng)
- 一種用戶興趣表征及內(nèi)容推薦方法、裝置和設(shè)備





