[發(fā)明專利]一種可解釋、可交互的用戶畫像方法及裝置有效
| 申請?zhí)枺?/td> | 202011024688.9 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112131475B | 公開(公告)日: | 2023-10-10 |
| 發(fā)明(設(shè)計)人: | 鄭馳;蔡苗;夏燕;張金鳳 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216 |
| 代理公司: | 北京同恒源知識產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 楊柳岸 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 可解釋 交互 用戶 畫像 方法 裝置 | ||
本發(fā)明涉及一種可解釋、可交互的用戶畫像方法及裝置,屬于計算機技術(shù)領(lǐng)域。首先按照可解釋的方法構(gòu)建用戶畫像標簽,然后使用Hive存儲用戶畫像標簽相關(guān)數(shù)據(jù),再使用ECharts使用戶畫像面向用戶可視化、可反饋,根據(jù)用戶對用戶畫像的調(diào)整,反饋用戶意見給系統(tǒng)進行優(yōu)化,最后采用反歧視以及準確性測試,檢驗用戶畫像的性能。所述可解釋、可交互的用戶畫像方法按照可解釋的方式構(gòu)建用戶畫像標簽,提高了用戶畫像的可理解性,支持用戶對用戶畫像進行調(diào)整,保護了用戶的知情權(quán)、自主權(quán)、隱私權(quán),也可以預(yù)防出現(xiàn)大數(shù)據(jù)殺熟、地域歧視等問題。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機技術(shù)領(lǐng)域,涉及一種可解釋、可交互的用戶畫像方法及裝置。
背景技術(shù)
對于諸如用戶屬性判斷、行為預(yù)測、風(fēng)險評估,需要收集以及關(guān)聯(lián)分析數(shù)據(jù),從而獲取新知識、優(yōu)化流程、提高決策能力,用戶畫像技術(shù)能夠?qū)崿F(xiàn)對用戶特征的刻畫,并能挖掘潛在價值信息,提高決策能力,實現(xiàn)精準化服務(wù)、現(xiàn)代化治理。用戶畫像一般是需要構(gòu)建用戶畫像標簽體系,已有的專利說明書公開了一種保護隱私的用戶畫像生成方法,通過在對用戶標簽數(shù)據(jù)集合進行聚類時,對標簽數(shù)據(jù)集合中的標簽數(shù)據(jù)落在每個矩形單元的計數(shù)值進行處理,對計數(shù)值進行保護,從而保護用戶的隱私權(quán)。
但是,即使采用這種方法保護了隱私權(quán),但仍存在用戶畫像應(yīng)用中,用戶信息自主權(quán)、知情權(quán)、平等權(quán)受損的問題。用戶畫像一般不對用戶公開,用戶直接接收基于用戶畫像的個性化推送、風(fēng)險評估結(jié)果,缺少在用戶畫像構(gòu)建過程中的主動參與、交互、監(jiān)督,導(dǎo)致用戶對自身的畫像并不知情,只能被動接受推送結(jié)果、評估結(jié)果,既侵害用戶選擇信息的自主權(quán),又使得用戶畫像的準確性難以得到直接驗證,不準確的用戶畫像可能導(dǎo)致用戶體驗感變差、用戶粘性降低,而不公平的畫像規(guī)則甚至可能導(dǎo)致出現(xiàn)地域歧視、種族歧視等社會問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種可解釋、可交互的用戶畫像方法及裝置。
為達到上述目的,本發(fā)明提供如下技術(shù)方案:
一種可解釋、可交互的用戶畫像方法,該方法包括:
S10:按照可解釋的方法構(gòu)建用戶畫像標簽;
S20:使用Hive存儲用戶畫像標簽相關(guān)數(shù)據(jù);
S30:利用ECharts讓用戶畫像面向用戶可視化、可反饋;
S40:根據(jù)用戶對用戶畫像的調(diào)整,反饋用戶意見給系統(tǒng)進行優(yōu)化;
S50:采用反歧視以及準確性測試,檢驗用戶畫像的性能。
可選的,所述S10具體為:
確定使用的標簽類別,包括統(tǒng)計類標簽、規(guī)則類標簽、挖掘類標簽;
在構(gòu)建用戶畫像時,對用戶畫像的標簽進行自然語言解釋,包括對標簽類別、標簽數(shù)據(jù)來源、標簽推理規(guī)則進行解釋;
按照解釋的難度確定標簽所占的比例分別為統(tǒng)計類標簽50%、規(guī)則類標簽30%、挖掘類標簽20%。
可選的,所述確定使用的標簽類別中,挖掘類標簽利用隱因子模型LFM以及TF-IDF挖掘數(shù)據(jù),提交Spark任務(wù)進行計算。
可選的,所述S20具體為:
建立Hive用戶標簽表,確定標簽的名稱、內(nèi)容、解釋欄;
將計算出的用戶標簽向量值插入Hive用戶標簽表“內(nèi)容”中,將對標簽的自然語言解釋放在用戶標簽表中的“解釋欄”。
可選的,所述S30具體為:
引入ECharts文件,指定使用雷達圖;
雷達圖的指示器為Hive數(shù)據(jù)倉庫中存儲的用戶標簽,雷達圖的數(shù)據(jù)為每個用戶在對應(yīng)的用戶標簽上所得分數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011024688.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





