[發(fā)明專利]基于網(wǎng)絡(luò)拓?fù)浜臀臋n內(nèi)容的社團(tuán)發(fā)現(xiàn)和情感解釋方法在審
| 申請(qǐng)?zhí)枺?/td> | 201911050449.8 | 申請(qǐng)日: | 2019-10-31 |
| 公開(kāi)(公告)號(hào): | CN110851733A | 公開(kāi)(公告)日: | 2020-02-28 |
| 發(fā)明(設(shè)計(jì))人: | 金弟;劉孟荃 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06F16/9536 | 分類號(hào): | G06F16/9536;G06F16/33;G06Q50/00 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 網(wǎng)絡(luò) 拓?fù)?/a> 文檔 內(nèi)容 社團(tuán) 發(fā)現(xiàn) 情感 解釋 方法 | ||
本發(fā)明公開(kāi)一種基于網(wǎng)絡(luò)拓?fù)浜臀臋n內(nèi)容的社團(tuán)發(fā)現(xiàn)和情感解釋方法,主要步驟包括:構(gòu)建對(duì)應(yīng)的生成式概率圖模型,對(duì)生成網(wǎng)絡(luò)拓?fù)滏溄雍蜕删W(wǎng)絡(luò)結(jié)點(diǎn)內(nèi)容兩部分生成過(guò)程進(jìn)行刻畫(huà);根據(jù)概率圖模型中各參數(shù)服從的概率分布,以概率分布的形式刻畫(huà)生成過(guò)程,得到完全數(shù)據(jù)似然函數(shù);定義相關(guān)參數(shù),得到證據(jù)下界(ELBO);提取證據(jù)下界中與各個(gè)變分參數(shù)有關(guān)的部分,分別求偏導(dǎo),并等于0,求得各個(gè)變分參數(shù)的優(yōu)化結(jié)果;記錄所獲得的參數(shù)結(jié)果,利用參數(shù)訓(xùn)練出社團(tuán)的主題情感表示詞分布和標(biāo)簽分布最大值來(lái)表示社團(tuán)的主題和情感傾向,并將訓(xùn)練好的進(jìn)行可視化表示。
技術(shù)領(lǐng)域
本發(fā)明屬于復(fù)雜網(wǎng)絡(luò)分析、自然語(yǔ)言數(shù)據(jù)處理和數(shù)據(jù)挖掘領(lǐng)域,涉及社團(tuán)檢測(cè)技術(shù)和社交網(wǎng)絡(luò)推薦技術(shù),尤其涉及一種基于網(wǎng)絡(luò)拓?fù)浜臀臋n內(nèi)容的社團(tuán)發(fā)現(xiàn)和情感解釋方法,其實(shí)質(zhì)基于網(wǎng)絡(luò)拓?fù)浜徒Y(jié)點(diǎn)內(nèi)容信息的貝葉斯有向概率圖模型社團(tuán)發(fā)現(xiàn)方法。
背景技術(shù)
近幾年來(lái),隨著社交媒體平臺(tái)的快速發(fā)展,社交網(wǎng)絡(luò)產(chǎn)生了大量的數(shù)據(jù),為研究人員提供分析和了解互聯(lián)網(wǎng)上用戶和信息的機(jī)會(huì)。面對(duì)海量的數(shù)據(jù),社團(tuán)發(fā)現(xiàn)成為了在復(fù)雜網(wǎng)絡(luò)分析領(lǐng)域中的一項(xiàng)重要任務(wù),它可以在理解和分析社交網(wǎng)絡(luò)時(shí)提供一個(gè)群體性的視角。復(fù)雜網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)檢測(cè)已吸引了許多來(lái)自不同研究領(lǐng)域研究者的關(guān)注。目前已提出了許多基于不同理論和技術(shù)的方法,它們包括譜聚類,層次聚類,啟發(fā)式方法,模塊度優(yōu)化,動(dòng)力學(xué)方法和統(tǒng)計(jì)模型推斷等。傳統(tǒng)的社團(tuán)發(fā)現(xiàn)方法僅利用網(wǎng)絡(luò)拓?fù)湫畔ⅲ槍?duì)網(wǎng)絡(luò)中結(jié)點(diǎn)之間的鏈接模式來(lái)檢測(cè)網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)。最近研究發(fā)現(xiàn)網(wǎng)絡(luò)中的結(jié)點(diǎn)內(nèi)容信息(例如社交網(wǎng)絡(luò)中用戶發(fā)布的文檔內(nèi)容信息)對(duì)于檢測(cè)社團(tuán)結(jié)構(gòu)也是有幫助的。尤其是當(dāng)拓?fù)湫畔⒂性肼晻r(shí),可以用內(nèi)容信息進(jìn)行輔助彌補(bǔ),并且結(jié)點(diǎn)的內(nèi)容信息可以為社團(tuán)提供語(yǔ)義解釋,這對(duì)于理解社區(qū)檢測(cè)的結(jié)果非常有用。
然而,結(jié)合網(wǎng)絡(luò)拓?fù)浜蛢?nèi)容信息的社團(tuán)發(fā)現(xiàn)方法集中于使用文檔的主題來(lái)解釋社區(qū),即找出社團(tuán)中所有用戶所共同感興趣的話題,以此來(lái)表示為該社團(tuán)的主題。然而這些方法大都忽略了同樣非常重要的情感信息。在實(shí)際生活中,持有相似情感傾向的用戶們更有可能形成一個(gè)社團(tuán),而情感信息因?yàn)殡y以直接識(shí)別,所以雖然非常重要,但卻往往被忽略。近年來(lái)已有一些方法同時(shí)利用主題信息和情感傾向信息進(jìn)行社團(tuán)檢測(cè),但是這些方法都是假設(shè)一個(gè)社團(tuán)只有一個(gè)主題,或者只有一種特定的情感。但在實(shí)際情況中,同一個(gè)社團(tuán)中的用戶可能感興趣的主題有多個(gè),對(duì)不同的主題也都報(bào)有不同的情感傾向,單一的假設(shè)方式有時(shí)反而會(huì)導(dǎo)致得到的結(jié)果準(zhǔn)確性低,且缺乏實(shí)際意義。此外,大多數(shù)方法在對(duì)社團(tuán)進(jìn)行解釋時(shí),利用的是單詞來(lái)表示主題。而單個(gè)的詞匯有時(shí)會(huì)出現(xiàn)一詞多義的情況,這樣就會(huì)導(dǎo)致社團(tuán)解釋的結(jié)果出現(xiàn)語(yǔ)義模糊、不易理解的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于網(wǎng)絡(luò)拓?fù)浜臀臋n內(nèi)容的社團(tuán)發(fā)現(xiàn)和情感解釋方法,能夠有效解決傳統(tǒng)社團(tuán)發(fā)現(xiàn)方法僅利用單一主體信息或情感信息進(jìn)行社團(tuán)解釋的局限性,以及使用單個(gè)詞語(yǔ)對(duì)社團(tuán)主題解釋難以理解的問(wèn)題,從而構(gòu)建以主題和情感這兩個(gè)層次對(duì)社團(tuán)進(jìn)行解釋的社團(tuán)發(fā)現(xiàn)方法,提高社團(tuán)發(fā)現(xiàn)的準(zhǔn)確性,同時(shí)得到更細(xì)粒度、更容易理解的社團(tuán)解釋結(jié)果。
本發(fā)明針對(duì)現(xiàn)有技術(shù)的存在局限性,提出了一種有效結(jié)合網(wǎng)絡(luò)的拓?fù)湫畔⒑途W(wǎng)絡(luò)中的結(jié)點(diǎn)內(nèi)容信息的生成式模型,同時(shí)通過(guò)變分推斷算法進(jìn)行模型參數(shù)推斷,從主題和情感這兩個(gè)層次對(duì)社團(tuán)進(jìn)行解釋。并且利用社交網(wǎng)絡(luò)中特有的一種更具有概括性的標(biāo)簽詞(hashtag),同時(shí)利用用戶所發(fā)布的文檔中的普通詞和標(biāo)簽來(lái)表示社團(tuán)的主題,從而得到了更精準(zhǔn)的社團(tuán)檢測(cè)結(jié)果和更細(xì)粒度、更容易理解的社團(tuán)解釋結(jié)果。
為了達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是基于網(wǎng)絡(luò)拓?fù)浜臀臋n內(nèi)容的社團(tuán)發(fā)現(xiàn)和情感解釋方法,包括以下步驟:
1)構(gòu)建對(duì)應(yīng)的生成式概率圖模型,對(duì)生成網(wǎng)絡(luò)拓?fù)滏溄雍蜕删W(wǎng)絡(luò)結(jié)點(diǎn)內(nèi)容兩部分生成過(guò)程進(jìn)行刻畫(huà)。通過(guò)引入結(jié)點(diǎn)的社團(tuán)歸屬變量、結(jié)點(diǎn)內(nèi)容的主題、情感標(biāo)簽,以及相應(yīng)的轉(zhuǎn)移關(guān)系矩陣,同時(shí)將結(jié)點(diǎn)內(nèi)容分為標(biāo)簽和普通單詞兩類進(jìn)行區(qū)分,結(jié)合<社團(tuán),主題,情感>的詞分布,刻畫(huà)網(wǎng)絡(luò)中鏈接和結(jié)點(diǎn)內(nèi)容的生成概率圖模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911050449.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 動(dòng)態(tài)分布式環(huán)境中的自動(dòng)拓?fù)湫纬煞椒ā⑾到y(tǒng)及程序產(chǎn)品
- 一種網(wǎng)絡(luò)管理拓?fù)涞奶幚矸椒跋到y(tǒng)
- 物理拓?fù)涫褂霉芾矸椒ê拖到y(tǒng)
- 拓?fù)溥m配方法及裝置
- 一種基于SNMP和HTML5實(shí)現(xiàn)web網(wǎng)絡(luò)拓?fù)涞姆椒?/a>
- 一種網(wǎng)絡(luò)拓?fù)浣y(tǒng)一管理方法及系統(tǒng)
- 一種拓?fù)湟晥D的加載顯示方法及系統(tǒng)
- 開(kāi)關(guān)磁阻電機(jī)功率拓?fù)渫扑]方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 靈活定義的城域網(wǎng)網(wǎng)絡(luò)拓?fù)渖煞椒ê脱b置
- 一種網(wǎng)絡(luò)拓?fù)鋬?yōu)化方法、裝置以及系統(tǒng)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫(huà)生成方法、裝置及設(shè)備





