[發(fā)明專利]一種基于社交網(wǎng)絡(luò)的職業(yè)心理性格分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910066007.6 | 申請(qǐng)日: | 2019-01-24 |
| 公開(kāi)(公告)號(hào): | CN110060772B | 公開(kāi)(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計(jì))人: | 朱蔚恒;龍舜;石文娟;王會(huì)進(jìn) | 申請(qǐng)(專利權(quán))人: | 暨南大學(xué) |
| 主分類號(hào): | G16H50/20 | 分類號(hào): | G16H50/20;G16H15/00;G06F16/35;G06K9/62 |
| 代理公司: | 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 510632 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 社交 網(wǎng)絡(luò) 職業(yè) 心理 性格 分析 方法 | ||
1.一種基于社交網(wǎng)絡(luò)的職業(yè)心理性格分析方法,其特征在于:具體步驟為:
步驟一:采集用戶的基本信息,并且根據(jù)基本信息的內(nèi)容打上各種使用行為標(biāo)簽、主題標(biāo)簽、情感傾向標(biāo)簽,并且分別計(jì)算各個(gè)標(biāo)簽使用百分比,同時(shí)對(duì)基本信息內(nèi)用詞進(jìn)行統(tǒng)計(jì),包括高頻詞和它們的使用比率;
步驟二:構(gòu)造MBTI職業(yè)性格四維度的分類器,將性格分為動(dòng)力、信息收集、決策方式、生活方式四個(gè)維度共16種組合,利用訓(xùn)練數(shù)據(jù)對(duì)四方面的分類器分別進(jìn)行訓(xùn)練,并預(yù)測(cè)結(jié)果的準(zhǔn)確率和查全率對(duì)分類器進(jìn)行調(diào)優(yōu);
步驟三:采用了Adaboost迭代算法整合步驟二中分類器的分析結(jié)果,根據(jù)每次訓(xùn)練集之中每個(gè)樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來(lái)確定每個(gè)樣本的權(quán)值,將修改過(guò)權(quán)值的新數(shù)據(jù)集送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器最后融合起來(lái),作為MBTI進(jìn)行動(dòng)力、信息收集、決策方式、生活方式這四個(gè)方面分析所使用的分類器;
步驟四:當(dāng)需要分析一個(gè)目標(biāo)對(duì)象的職業(yè)性格心理的時(shí)候,首先通過(guò)爬蟲(chóng)采集他的社交網(wǎng)絡(luò)數(shù)據(jù),并且進(jìn)行步驟一的數(shù)據(jù)預(yù)處理,在完成預(yù)處理后,將得到的諸多特征輸入動(dòng)力、信息收集、決策方式、生活方式分類器,得到相關(guān)MBTI四個(gè)維度的分析結(jié)果,并根據(jù)MBTI職業(yè)性格心理分析報(bào)告模板,套用這些特征數(shù)據(jù)完成對(duì)象的MBTI分析報(bào)告;
所述步驟二中分類器分別進(jìn)行訓(xùn)練包括Logistic回歸算法,用于估計(jì)某種事物的可能性,是一個(gè)學(xué)習(xí)f:X-Y方程或者P(Y|X)的方法,其中Y是離散取值的,而X=X1,X2...,Xn是任意一個(gè)向量,其中每個(gè)特征分量Xi取離散或者連續(xù)值,用于概率預(yù)測(cè),也用于分類,而且不需要各特征Xi之間相互獨(dú)立,是當(dāng)前業(yè)界比較常用的機(jī)器學(xué)習(xí)方法,Logistic回歸方法包括:
1)構(gòu)造預(yù)測(cè)函數(shù)h;
2)構(gòu)造損失函數(shù)J;
3)想辦法使得J函數(shù)最小并求得回歸參數(shù)θ三步,其中:
1)構(gòu)造預(yù)測(cè)函數(shù)h,使用Logistic函數(shù),形式為:
對(duì)于線性邊界的情況,邊界形式如下:
構(gòu)造預(yù)測(cè)函數(shù)為:
函數(shù)hθ(x)的值有特殊的含義,它表示結(jié)果取1的概率,因此對(duì)于輸入x分類結(jié)果為類別1和類別0的概率分別為:
2)構(gòu)造損失函數(shù)J,Cost函數(shù)和J函數(shù)是基于最大似然估計(jì)推導(dǎo)得到的:
3)最大似然估計(jì)就是求使l(θ)取最大值時(shí)的θ,這里使用梯度上升法求解,求得的θ就是要求的最佳參數(shù),采用以下公式:
即取J(θ)最小值時(shí)的θ為要求的最佳參數(shù),
θ更新過(guò)程寫成:
所述步驟二中分類器分別進(jìn)行訓(xùn)練包括人工神經(jīng)網(wǎng)絡(luò),是從信息處理角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,通過(guò)建立某種簡(jiǎn)單模型,按不同的連接方式組成不同的網(wǎng)絡(luò),是一種運(yùn)算模型,由大量的神經(jīng)元之間相互聯(lián)接構(gòu)成,每個(gè)神經(jīng)元代表一種特定的輸出函數(shù),稱為激勵(lì)函數(shù),每對(duì)神經(jīng)元間的連接都代表一個(gè)對(duì)于通過(guò)該連接信號(hào)的加權(quán)值,稱為權(quán)重,網(wǎng)絡(luò)的輸出則依網(wǎng)絡(luò)的連接方式,權(quán)重值和激勵(lì)函數(shù)的不同而不同;
所述步驟二中分類器分別進(jìn)行訓(xùn)練包括采用了C4.5算法實(shí)現(xiàn)決策樹(shù),該算法如下所示:
所述步驟二中分類器分別進(jìn)行訓(xùn)練包括使用Apriori算法,進(jìn)行關(guān)聯(lián)規(guī)則挖掘,該算法使用頻繁項(xiàng)集的先驗(yàn)知識(shí),使用一種稱作逐層搜索的迭代方法,k項(xiàng)集用于探索(k+1)項(xiàng)集,首先,通過(guò)掃描事務(wù)記錄,找出所有的頻繁1項(xiàng)集,該集合記做L1,然后利用L1找頻繁2項(xiàng)集的集合L2,L2找L3,如此下去,直到不能再找到任何頻繁k項(xiàng)集,最后再在所有的頻繁集中找出強(qiáng)規(guī)則,即產(chǎn)生用戶感興趣的關(guān)聯(lián)規(guī)則:
Apriori算法采用連接步和剪枝步兩種方式來(lái)找出所有的頻繁項(xiàng)集:
1)連接步:為找出Lk,Lk為所有的頻繁k項(xiàng)集的集合,通過(guò)將Lk-1與自身連接產(chǎn)生候選k項(xiàng)集的集合,Lk-1為所有的頻繁k-1項(xiàng)集的集合,候選集合記作Ck,設(shè)l1和l2是Lk-1中的成員,記li[j]表示li中的第j項(xiàng),假設(shè)Apriori算法對(duì)事務(wù)或項(xiàng)集中的項(xiàng)按字典次序排序,
即對(duì)于(k-1)項(xiàng)集li,li[1]li[2]……li[k-1],
將Lk-1與自身連接,如果(l1[1]=l2[1])(l1[2]=l2[2])……(l1[k-2]=l2[k-2])(l1[k-1]l2[k-1]),那認(rèn)為l1和l2是可連接,連接l1和l2產(chǎn)生的結(jié)果是{l1[1],l1[2],……,l1[k-1],l2[k-1]};
2)剪枝步:CK是LK的超集,也就是說(shuō),CK的成員可能是也可能不是頻繁的,通過(guò)掃描所有的事務(wù),確定CK中每個(gè)候選的計(jì)數(shù),判斷是否小于最小支持度計(jì)數(shù),如果不是,則認(rèn)為該候選是頻繁的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于暨南大學(xué),未經(jīng)暨南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910066007.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對(duì)象搜索方法及裝置
- 針對(duì)嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 職業(yè)數(shù)據(jù)轉(zhuǎn)換的方法、裝置、網(wǎng)絡(luò)服務(wù)器
- 職業(yè)成熟度調(diào)查方法
- 一種職業(yè)危害告知系統(tǒng)
- 職業(yè)等級(jí)管控系統(tǒng)及方法
- 一種職業(yè)規(guī)劃路徑架構(gòu)系統(tǒng)及處理方法
- 一種用人單位職業(yè)衛(wèi)生管理系統(tǒng)及方法
- 基于EMLo預(yù)訓(xùn)練模型的職業(yè)指導(dǎo)方法、裝置及存儲(chǔ)介質(zhì)
- 基于用戶職業(yè)預(yù)測(cè)的風(fēng)險(xiǎn)評(píng)估方法、裝置和電子設(shè)備
- 一種具有隱藏式口袋的職業(yè)服
- 基于物聯(lián)網(wǎng)遠(yuǎn)程職業(yè)教育平臺(tái)及系統(tǒng)





