[發(fā)明專(zhuān)利]基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202211595455.3 | 申請(qǐng)日: | 2022-12-13 |
| 公開(kāi)(公告)號(hào): | CN115587263A | 公開(kāi)(公告)日: | 2023-01-10 |
| 發(fā)明(設(shè)計(jì))人: | 馬行空;蔡依青;劉波;李少勇;邱厚杰;陳鑫益;洪學(xué)恕;李國(guó)偉;李華鋼 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)人民解放軍國(guó)防科技大學(xué) |
| 主分類(lèi)號(hào): | G06F16/9536 | 分類(lèi)號(hào): | G06F16/9536;G06F16/951;G06F18/214;G06F18/2431;G06F18/2411;G06Q50/00;G06N20/10;G06N20/20 |
| 代理公司: | 長(zhǎng)沙國(guó)科天河知識(shí)產(chǎn)權(quán)代理有限公司 43225 | 代理人: | 邱軼 |
| 地址: | 410073 湖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 社交 網(wǎng)絡(luò) 數(shù)據(jù) 社會(huì)心理 預(yù)測(cè) 方法 | ||
1.一種基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,包括步驟:
利用Scrapy框架爬蟲(chóng)從社交網(wǎng)絡(luò)平臺(tái)上爬取待測(cè)用戶的社交網(wǎng)絡(luò)數(shù)據(jù);
根據(jù)預(yù)設(shè)的社會(huì)心理特征和用戶特征之間的映射關(guān)系,從所述社交網(wǎng)絡(luò)數(shù)據(jù)中提取與所述社會(huì)心理特征最相關(guān)的用戶特征數(shù)據(jù);所述用戶特征數(shù)據(jù)包括個(gè)人統(tǒng)計(jì)學(xué)特征數(shù)據(jù)、大五人格特征數(shù)據(jù)和關(guān)聯(lián)特征數(shù)據(jù);
將所述用戶特征數(shù)據(jù)輸入訓(xùn)練好的社會(huì)心理預(yù)測(cè)模型,輸出所述待測(cè)用戶的社會(huì)心理預(yù)測(cè)標(biāo)簽;所述社會(huì)心理預(yù)測(cè)模型為預(yù)先使用公開(kāi)數(shù)據(jù)集和社交網(wǎng)絡(luò)數(shù)據(jù)集訓(xùn)練得到。
2.根據(jù)權(quán)利要求1所述的基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,利用Scrapy框架爬蟲(chóng)從社交網(wǎng)絡(luò)平臺(tái)上爬取待測(cè)用戶的社交網(wǎng)絡(luò)數(shù)據(jù)的步驟,包括:
確定待測(cè)用戶所在社交網(wǎng)絡(luò)平臺(tái)上待爬取信息的統(tǒng)一資源定位符隊(duì)列;
根據(jù)所述統(tǒng)一資源定位符隊(duì)列,分別爬取每個(gè)統(tǒng)一資源定位符對(duì)應(yīng)的社交網(wǎng)頁(yè)內(nèi)容;
分別對(duì)各所述社交網(wǎng)頁(yè)內(nèi)容進(jìn)行解析處理,得到所述待測(cè)用戶的所述社交網(wǎng)絡(luò)數(shù)據(jù)并存入設(shè)定數(shù)據(jù)庫(kù)中。
3.根據(jù)權(quán)利要求2所述的基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,所述社交網(wǎng)絡(luò)數(shù)據(jù)包括公開(kāi)的用戶個(gè)人信息、發(fā)布的社交信息和互動(dòng)行為信息。
4.根據(jù)權(quán)利要求1所述的基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,所述關(guān)聯(lián)特征數(shù)據(jù)的提取過(guò)程,包括:
將所述社交網(wǎng)絡(luò)數(shù)據(jù)中的特征相關(guān)數(shù)據(jù)進(jìn)行分類(lèi);所述特征相關(guān)數(shù)據(jù)包括用戶關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)活動(dòng)微博或媒體微博數(shù)據(jù),所述分類(lèi)的類(lèi)型包括關(guān)注數(shù)量、點(diǎn)贊數(shù)量、點(diǎn)贊文本、轉(zhuǎn)發(fā)數(shù)量和轉(zhuǎn)發(fā)文本;
根據(jù)關(guān)注數(shù)量確定用戶對(duì)活動(dòng)類(lèi)信息的感興趣程度;
根據(jù)點(diǎn)贊數(shù)量和轉(zhuǎn)發(fā)數(shù)量確定用戶是否使用活動(dòng)微博或媒體微博查看活動(dòng)類(lèi)信息;
根據(jù)點(diǎn)贊文本和轉(zhuǎn)發(fā)文本的所有數(shù)據(jù)計(jì)算用戶對(duì)活動(dòng)微博的信任度。
5.根據(jù)權(quán)利要求1所述的基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,所述社會(huì)心理預(yù)測(cè)模型為基于公開(kāi)數(shù)據(jù)集和社交網(wǎng)絡(luò)數(shù)據(jù)集,采用邏輯回歸、支持向量機(jī)、XGBoost、決策樹(shù)和隨機(jī)森林學(xué)習(xí)算法訓(xùn)練得到的預(yù)測(cè)模型。
6.根據(jù)權(quán)利要求5所述的基于社交網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)心理預(yù)測(cè)方法,其特征在于,所述社會(huì)心理預(yù)測(cè)模型的訓(xùn)練過(guò)程,包括:
從社會(huì)調(diào)查網(wǎng)站獲取關(guān)于社會(huì)意識(shí)調(diào)查的所述公開(kāi)數(shù)據(jù)集;
對(duì)所述公開(kāi)數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理;
在預(yù)處理后的所述公開(kāi)數(shù)據(jù)集中,根據(jù)設(shè)定的社會(huì)心理分類(lèi)標(biāo)簽提取目標(biāo)社會(huì)心理特征并抽取各用戶特征;
利用在線數(shù)據(jù)統(tǒng)計(jì)分析工具對(duì)所述目標(biāo)社會(huì)心理特征和各用戶特征進(jìn)行數(shù)據(jù)相關(guān)性分析,確定與所述目標(biāo)社會(huì)心理特征最相關(guān)的用戶特征類(lèi)型;
利用Scrapy框架爬蟲(chóng)從社交網(wǎng)絡(luò)平臺(tái)上爬取各用戶的社交網(wǎng)絡(luò)數(shù)據(jù);
根據(jù)所述用戶特征類(lèi)型,從所述社交網(wǎng)絡(luò)數(shù)據(jù)中提取各用戶的用戶特征數(shù)據(jù);
基于所述目標(biāo)社會(huì)心理特征和各用戶的所述用戶特征數(shù)據(jù)組成的訓(xùn)練集,采用邏輯回歸、支持向量機(jī)、XGBoost、決策樹(shù)和隨機(jī)森林學(xué)習(xí)算法訓(xùn)練得到所述社會(huì)心理預(yù)測(cè)模型。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)人民解放軍國(guó)防科技大學(xué),未經(jīng)中國(guó)人民解放軍國(guó)防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211595455.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對(duì)象搜索方法及裝置
- 針對(duì)嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





