[發(fā)明專利]一種基于復(fù)雜網(wǎng)絡(luò)特性及神經(jīng)網(wǎng)絡(luò)聚類挖掘用戶興趣的方法有效
| 申請?zhí)枺?/td> | 201610056077.X | 申請日: | 2016-01-27 |
| 公開(公告)號: | CN105740381B | 公開(公告)日: | 2019-05-17 |
| 發(fā)明(設(shè)計)人: | 張興蘭;劉煬 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京思海天達知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 復(fù)雜 網(wǎng)絡(luò) 特性 神經(jīng)網(wǎng)絡(luò) 挖掘 用戶 興趣 方法 | ||
本發(fā)明涉及一種基于復(fù)雜網(wǎng)絡(luò)特性及神經(jīng)網(wǎng)絡(luò)聚類挖掘用戶興趣的方法,主要從以下三方面進行設(shè)計,1)構(gòu)建復(fù)雜網(wǎng)絡(luò)模型,2)確定節(jié)點重要性指標(biāo),3)神經(jīng)網(wǎng)絡(luò)聚類;本方法將復(fù)雜網(wǎng)絡(luò)模型應(yīng)用到用戶軟件興趣的挖掘中,建立用戶使用軟件的復(fù)雜網(wǎng)絡(luò),并使用節(jié)點的度、聚集系數(shù)、節(jié)點介數(shù)和節(jié)點的概率特性指標(biāo)確定節(jié)點的重要性排序,形成用戶興趣集,再利用神經(jīng)網(wǎng)絡(luò)模型挖掘興趣集的聚類,確定用戶最終興趣集,為挖掘用戶興趣模型提供了一種新的方法,并且將用戶軟件興趣的挖掘精確性大幅提高,同時這種方法可以對用戶的多種興趣進行挖掘。
技術(shù)領(lǐng)域
本發(fā)明涉及挖掘用戶興趣的方法,尤其涉及一種基于復(fù)雜網(wǎng)絡(luò)特性及神經(jīng)網(wǎng)絡(luò)聚類挖掘用戶興趣的方法,從用戶使用軟件的行為日志中挖掘用戶感興趣的軟件,屬于人工智能領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,軟件技術(shù)作為信息產(chǎn)業(yè)的一種,其發(fā)展也不可小覷,各種新產(chǎn)品、新應(yīng)用層出不窮,已經(jīng)成為生產(chǎn)和生活的重要組成部分。在電子產(chǎn)品如此泛濫的時代,如何抓住用戶的興趣、提高用戶對于產(chǎn)品的忠實度和興趣感,成為提升企業(yè)核心競爭力的一個強有力的方案。由于用戶使用電子產(chǎn)品(PC或者手機)的過程都是使用各種各樣軟件的過程,所以對用戶使用軟件的行為日志進行分析,挖掘用戶感興趣的軟件,獲取用戶的興趣集,使得產(chǎn)品開發(fā)商可以根據(jù)獲取的用戶興趣集提供個性化的信息服務(wù),開展增值業(yè)務(wù),提高產(chǎn)品綜合價值。
近年來,機器學(xué)習(xí)領(lǐng)域吸引了越來越多的關(guān)注和研究,隨著信息科技的進步、人類行為學(xué)的發(fā)展,國內(nèi)外的研究學(xué)者已經(jīng)將用戶行為分析挖掘的理論進行了實踐研究,并逐步轉(zhuǎn)入商業(yè)應(yīng)用的階段,取得了良好的成效。大量的研究表明根據(jù)用戶行為日志挖掘用戶興趣是具有一定研究意義和應(yīng)用價值的。其中Ford等人采用AprioriAll序列規(guī)則挖掘算法對用戶訪問站點的日志進行研究分析,獲取用戶的訪問興趣,并根據(jù)用戶的興趣設(shè)置廣告投放,提高了網(wǎng)站的商業(yè)價值,但是AprioriAll算法只適用于挖掘用戶感興趣的關(guān)聯(lián)序列,不適用于挖掘用戶興趣的排列順序。李建廷等人提出了基于用戶瀏覽動作分析用戶興趣度的計算方法,充分考慮了用戶訪問次數(shù)、訪問動作、訪問速度三種訪問模式下的用戶興趣度的計算方式,并利用BP神經(jīng)網(wǎng)絡(luò)將這三種模式下的用戶興趣度進行融合,取得了良好的實驗效果,這對神經(jīng)網(wǎng)絡(luò)算法研究用戶興趣度的融合以及聚類提供了思想,但是BP神經(jīng)網(wǎng)絡(luò)對于網(wǎng)絡(luò)的初始權(quán)重十分敏感,不同的初始化值往往會造成不同的訓(xùn)練結(jié)果,這很容易造成偏差。王微微等人提出了一種基于用戶行為日志挖掘用戶興趣的模型,結(jié)合用戶的瀏覽內(nèi)容和行為模式建立用戶興趣向量,再根據(jù)期望最大化的計算方法實現(xiàn)用戶聚類,建立最終的用戶興趣模型,該模型雖然可以識別用戶的購買興趣,卻沒有充分考慮用戶行為之間的順序,即行為的前后序列關(guān)系。王梓等人提出了一種基于復(fù)合關(guān)鍵詞向量空間的方法,最大限度將用戶感興趣的關(guān)鍵詞建立關(guān)聯(lián)關(guān)系,但其選用的關(guān)鍵詞是基于產(chǎn)品屬性的,其方法不具有普遍通用性。
復(fù)雜網(wǎng)絡(luò)技術(shù)是大數(shù)據(jù)處理技術(shù)的一種,是從復(fù)雜性科學(xué)角度出發(fā),探索隱藏在大數(shù)據(jù)中真正的數(shù)據(jù)價值。復(fù)雜網(wǎng)絡(luò)主要是依靠一切事務(wù)都具有相互作用的表現(xiàn)(例如WWW中網(wǎng)頁之間的鏈接關(guān)系、文章之間的引用關(guān)系和超市中啤酒尿布的關(guān)聯(lián)關(guān)系),利用網(wǎng)絡(luò)的視角建立數(shù)據(jù)模型,挖掘數(shù)據(jù)規(guī)則,并通過復(fù)雜網(wǎng)絡(luò)的小世界效應(yīng)和無標(biāo)度特性計算網(wǎng)絡(luò)中節(jié)點的重要性,形成網(wǎng)絡(luò)節(jié)點的重要性序列。聚類是數(shù)據(jù)挖掘中的一個重要組成部分,是通過度量樣本間的相似性,發(fā)現(xiàn)隱藏在底層的關(guān)聯(lián)性數(shù)據(jù)的又一個常見方法。
為了從用戶使用軟件的行為日志中獲取用戶感興趣的軟件,本方法應(yīng)用復(fù)雜網(wǎng)絡(luò)中的理論知識以及神經(jīng)網(wǎng)絡(luò)聚類的方法,先形成用戶的興趣軟件集,然后再應(yīng)用神經(jīng)網(wǎng)絡(luò)算法對興趣軟件集中的軟件進行聚類,實現(xiàn)這兩種方法的結(jié)合,計算用戶興趣軟件集。首先根據(jù)用戶行為間的相互作用建立復(fù)雜網(wǎng)絡(luò)模型,將軟件看作復(fù)雜網(wǎng)絡(luò)中的節(jié)點,按照軟件使用的順序構(gòu)建邊,充分考慮了用戶使用軟件之間的關(guān)聯(lián)關(guān)系。然后根據(jù)復(fù)雜網(wǎng)絡(luò)模型的統(tǒng)計指標(biāo)和行為本身的概率特性,計算網(wǎng)絡(luò)節(jié)點的重要性序列,形成用戶興趣節(jié)點社區(qū)。最后利用word2vec工具形成軟件的向量,根據(jù)向量之間的余弦距離衡量軟件的相似性,實現(xiàn)用戶興趣社區(qū)聚類,合并聚類形成最終的用戶感興趣的軟件集合。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610056077.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





