[發(fā)明專利]一種基于LDA主題模型算法的用戶細分方法在審
| 申請?zhí)枺?/td> | 201410317014.6 | 申請日: | 2014-07-04 |
| 公開(公告)號: | CN104050298A | 公開(公告)日: | 2014-09-17 |
| 發(fā)明(設計)人: | 張一文 | 申請(專利權)人: | 成都品果科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 成都九鼎天元知識產(chǎn)權代理有限公司 51214 | 代理人: | 鄧世燕 |
| 地址: | 610041 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lda 主題 模型 算法 用戶 細分 方法 | ||
技術領域
本發(fā)明涉及一種基于LDA主題模型算法的用戶細分方法。
背景技術
本發(fā)明先介紹用戶細分過程,緊隨其后的是個人偏好小節(jié),最終則得出關于LDA理論方面的簡要介紹。
1.用戶分類
數(shù)據(jù)挖掘可以提供客戶洞察力,這對建立有效的市場營銷、銷售以及個性化策略是至關重要的。它會導致客戶之間的個性化交流,因此通過數(shù)據(jù)分析來提升滿意度以及有益的客戶關系。
通過客戶生活周期的各個階段,即從獲取和建立一種強大的關系到預防摩擦和贏回失去的客戶,它可支持一種“個性化”且優(yōu)化的客戶管理。營銷人員努力獲得更大的市場份額以及更大比例的客戶。簡單來講,他們負責獲取、開發(fā)并維持顧客。
為了能夠提供個性化的市場營銷戰(zhàn)略,用戶細分的主要流程是根據(jù)用戶的一些特征,把用戶群劃分為不同的群體。
在手動或者傳統(tǒng)用戶細分中,通常按用戶的行為和使用特點進行細分。盡管行為分類可以由業(yè)務規(guī)則創(chuàng)建,但這項方法擁有很多基礎性的缺點:它只能有效地處理少數(shù)分類領域,而且其客觀性是受到質(zhì)疑的,因為它是基于業(yè)務專家的個人感知。
另一方面,基于數(shù)據(jù)挖掘的方法可以創(chuàng)建數(shù)據(jù)驅(qū)動的行為細分。細分算法可以分析行為數(shù)據(jù),確認不同群組的客戶并且提出基于數(shù)據(jù)格式的方法。
流行的基于數(shù)據(jù)挖掘的分類方法包括:價值基礎細分法(value-based?segmentation)、行為細分法(behavioral?segmentation)、忠誠度細分法(loyalty?segmentation)、社會細分法(socio-based?segmentation)以及需求基礎細分法(needs-based?segmentation)。
還存在另一種用戶細分法,該方法是建立在個人偏好主觀性的基礎上的。
2.個人偏好
個人偏好可以看作是對于特定的物體或者概念的情感、行為以及感受的獨特結(jié)合,這種全面融合使得用戶細分方法更具個性化的獨特性。
為了更好地了解用戶,可以定義許多個人偏好,用于量化客戶。比如:
(1)喜歡玩游戲的用戶;
(2)喜歡聽音樂的用戶;
(3)喜歡看電影的用戶;
(4)喜歡網(wǎng)上購物的用戶;
(5)喜歡閱讀的用戶;
(6)喜歡旅行的用戶;
(7)喜歡美食的用戶。
為了將這些個性化標簽應用到用戶身上,從而有效地細分用戶,首先需要了解他們的不同特征。這是項挑戰(zhàn)性工作,因為用戶不會明確地告訴我們他們是誰,偏好是什么;我們需要根據(jù)一些隱含信息來間接地獲取。
舉例來說,用戶隱含的一些信息如下:他們所聽的音樂類型、喜歡看的電影或者電視劇類型、瀏覽的網(wǎng)站類型、喜歡拍或者觀賞的照片、社交網(wǎng)絡上結(jié)交的朋友類型以及喜歡閱讀的書籍類型。最終,我們能夠從社交網(wǎng)絡上搜尋到某個特定的用戶,例如他們的愛好和私人信息。
本發(fā)明并不關注如何從用戶獲取這些隱含的私人特征。本發(fā)明假設這些用戶間接信息或特征已經(jīng)獲取了,并且基于那些信息建立LDA模型。
3.Latent?Dirichlet?Allocation(潛在主題抽取)算法
Latent?Dirichlet?Allocation(潛在主題抽取)或者LDA,是一種被應用在文本挖掘方面的機器學習方法,通常目的在于從一個文檔集合中自動發(fā)現(xiàn)專題論題。
簡而言之,LDA模型從一大堆文檔集合中抽取一個預先確定數(shù)量的主題,而且該訓練模式可以被用來推斷其后任何文檔的主題(不同的權重)。例如,一個文檔談論蘋果電腦和汽車,那么其推斷主題很可能即為“電腦”和“汽車”。
主題建模是指,將整個文檔集合細分成相關少數(shù)主題的詞并且作為主題融合代表每個文檔。這樣,通過察看主題中的詞就可以解釋這個模型。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術的上述缺點,本發(fā)明提供了一種基于LDA主題模型算法的用戶細分方法,目的在于將社交網(wǎng)絡平臺上眾多的用戶或客戶貼上富有個性化的標簽,例如游戲玩家、社交網(wǎng)絡發(fā)燒友、音樂愛好者、喜歡網(wǎng)上購物、高級用戶、旅行家、喜歡閱讀的等其他標簽。而且,根據(jù)本發(fā)明,一個用戶或客戶還可以同時繼承多個標簽。
本發(fā)明解決其技術問題所采用的技術方案是:一種基于LDA主題模型算法的用戶細分方法,包括如下步驟:
步驟一、隨機挑選一組用戶,并為每一用戶建立一個對應的文本文檔;
步驟二、構(gòu)建用戶偏好屬性字典;
步驟三、LDA模型訓練:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都品果科技有限公司,未經(jīng)成都品果科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410317014.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:集成電路設計中的通孔嵌入
- 下一篇:一種交互方法及系統(tǒng)





