[發(fā)明專利]基于基尼系數(shù)測度的用戶興趣模式劃分方法有效
| 申請?zhí)枺?/td> | 201210133502.2 | 申請日: | 2012-04-28 |
| 公開(公告)號: | CN102693335A | 公開(公告)日: | 2012-09-26 |
| 發(fā)明(設(shè)計(jì))人: | 胡錚;張平;花青松;劉海峰;田輝;白海 | 申請(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 系數(shù) 測度 用戶 興趣 模式 劃分 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)建模技術(shù)領(lǐng)域,特別涉及一種基于基尼系數(shù)測度的用戶興趣模式劃分方法。
背景技術(shù)
用戶興趣模式是多種多樣的,有些用戶屬于興趣廣泛型,其對各領(lǐng)域的喜歡程度得分布相對比較均勻;有些用戶則是專一喜歡極少類別的事物,其對各領(lǐng)域喜歡程度的分布相對并不均勻。很多時(shí)候,即便不同用戶喜歡的事物不同,卻擁有相同的興趣模式,比如一個(gè)用戶是音樂發(fā)燒友只喜歡音樂,另一個(gè)用戶是軍事發(fā)燒友只喜歡軍事,盡管音樂和軍事所屬領(lǐng)域大不相同,但是這兩個(gè)用戶都是單興趣類型用戶,他們擁有相同興趣模式。而目前有關(guān)用戶興趣的研究缺乏對用戶興趣模式的度量方法。因此有必要找到一種測度用戶興趣模式的方法。
經(jīng)濟(jì)學(xué)中基尼系數(shù)對于研究用戶興趣模式分類有很大的借鑒意義。基尼系數(shù)是經(jīng)濟(jì)學(xué)中國際上通用的評估社會(huì)貧富差異的一種度量方法,度量的是社會(huì)總收入在全體人口中的分布情況,這與用戶興趣模式的研究度量用戶興趣在各領(lǐng)域間相對分布的問題有很大相似之處。
為了研究社會(huì)財(cái)富分配不平等問題,1905年美國統(tǒng)計(jì)學(xué)家M.O.洛倫茨(Max?Otto?Lorenz)提出了著名的洛倫茨曲線(lurenz?curve)。經(jīng)濟(jì)學(xué)中的洛倫茨曲線(圖1中實(shí)心線)是一種財(cái)富分布累計(jì)函數(shù)的圖形化表示方法。
對于圖1中洛倫茨曲線上任一點(diǎn)(x%,y%),它的含義是貧到富排列前x%的人口的累計(jì)總收入占社會(huì)總收入的比例是y%。圖中“絕對公平線”(curve?of?absolute?equality)表示社會(huì)總收入在全體居民中絕對平均分配時(shí)的收入分配曲線,是一條“y=x”的直線;“絕對不公平線”(Curve?of?absolute?inequality)是社會(huì)所有收入被一個(gè)人唯一占據(jù)時(shí)的收入分配曲線,是一條垂直于x軸的直線。洛倫茨曲線一般位于絕對公平線與絕對不公平線之間。
1912年,意大利經(jīng)濟(jì)學(xué)家基尼根據(jù)洛倫茨曲線,提出了基尼系數(shù)(Gini?coefficient)。基尼系數(shù)作為測度一個(gè)變量分布集中度(不平均性質(zhì))的指標(biāo),現(xiàn)代經(jīng)濟(jì)學(xué)中常用其來度量貧富差距。如圖1所示,設(shè)洛倫茨曲線和絕對公平線之間的面積為A,洛倫茨曲線與絕對不公平線和x軸圍成的圖形面積為B。并以A除以A+B的商表示不平等程度即為基尼系數(shù)。用以下公式(1)表示為:
這個(gè)數(shù)值被稱為基尼系數(shù)或稱洛倫茨系數(shù),大小位于0到1之間。洛倫茨曲線與絕對公平線之間的面積A越小,收入分配越是趨向平等,洛倫茨曲線的弧度也就越小,基尼系數(shù)也越小;反之,收入分配越是趨向不平等,洛倫茨曲線的弧度越大,那么基尼系數(shù)也越大。
基尼系數(shù)在度量貧富差距時(shí),其本質(zhì)假設(shè)是社會(huì)的總收入是同質(zhì)的,度量其在全體人口的分布情況。
現(xiàn)有技術(shù)集中在依據(jù)用戶興趣相似度研究用戶偏好。缺乏從用戶興趣模式角度研究用戶興趣,無法準(zhǔn)確地對用戶興趣模式進(jìn)行劃分。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題
本發(fā)明要解決的技術(shù)問題是:如何準(zhǔn)確地對用戶興趣模式進(jìn)行劃分。
(二)技術(shù)方案
為解決上述技術(shù)問題,本發(fā)明提供了一種基于基尼系數(shù)測度用戶興趣劃分方法,包括以下步驟:
S1:基于向量空間模型VSM架構(gòu)用戶興趣模型,用戶興趣領(lǐng)域集合為T={興趣1,興趣2,...,興趣N},對于任何一個(gè)用戶,其用戶興趣模型可以表示為U={<興趣1,興趣度1>,...,<興趣N,興趣度N>};
S2:對用戶興趣模型按照用戶興趣度升序進(jìn)行排序,得到排序后的用戶興趣度為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210133502.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 生成系數(shù)類型數(shù)據(jù)或系數(shù)數(shù)據(jù)的裝置、方法
- 串?dāng)_系數(shù)估計(jì)裝置和串?dāng)_系數(shù)估計(jì)方法
- 排放系數(shù)計(jì)算器與排放系數(shù)計(jì)算方法
- 摩擦系數(shù)估計(jì)設(shè)備和摩擦系數(shù)估計(jì)方法
- 吸隔音系數(shù)試樣及阻尼系數(shù)試樣取樣裝置
- 用于系數(shù)掃描的系數(shù)群及系數(shù)譯碼
- 導(dǎo)熱系數(shù)測量裝置以及導(dǎo)熱系數(shù)測量方法
- 一種PID參數(shù)自整定方法
- 變換系數(shù)計(jì)算裝置、變換系數(shù)計(jì)算方法及變換系數(shù)計(jì)算程序
- 導(dǎo)熱系數(shù)儀
- 汽車活塞環(huán)光密封性檢測工裝
- 識別神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)源
- 分布式系統(tǒng)中多層次測度網(wǎng)絡(luò)關(guān)系構(gòu)建方法
- 識別神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)源的系統(tǒng)和方法
- 小電流接地系統(tǒng)綜合選線故障測度計(jì)算方法
- 一種城市建設(shè)水平預(yù)測系統(tǒng)
- 一種智慧城市建設(shè)測度方法
- 一種基于MATLAB軟件的深海管道綜合風(fēng)險(xiǎn)指標(biāo)評價(jià)方法
- 一種帶有噪聲相關(guān)的非線性可觀測度分析方法
- 一種建筑工程垂直度測量裝置





