[發(fā)明專利]一種基于多元化關(guān)系畫像技術(shù)的在線社會(huì)關(guān)系搜索方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010153660.9 | 申請(qǐng)日: | 2020-03-06 |
| 公開(公告)號(hào): | CN111488401B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計(jì))人: | 王博;楊毅 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06F16/28 | 分類號(hào): | G06F16/28;G06F16/26;G06F16/245 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 李麗萍 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多元化 關(guān)系 畫像 技術(shù) 在線 社會(huì)關(guān)系 搜索 方法 | ||
1.一種基于多元化關(guān)系畫像技術(shù)的在線社會(huì)關(guān)系搜索方法,其特征在于,首先,針對(duì)指定的語料數(shù)據(jù)基于非直觀畫像方法和直觀畫像方法得到人際關(guān)系畫像;然后,通過人際關(guān)系在線畫像系統(tǒng)將人際關(guān)系畫像進(jìn)行可視化,即得到與該人際關(guān)系畫像結(jié)果對(duì)應(yīng)的社會(huì)關(guān)系網(wǎng)絡(luò)拓?fù)鋱D,根據(jù)設(shè)定的好友關(guān)系數(shù)量和好友關(guān)系類型在該社會(huì)關(guān)系網(wǎng)絡(luò)拓?fù)鋱D中進(jìn)行人物搜索,根據(jù)與設(shè)定的關(guān)系個(gè)例最相似的關(guān)系在該社會(huì)關(guān)系網(wǎng)絡(luò)拓?fù)鋱D中進(jìn)行人物關(guān)系搜索,并實(shí)時(shí)顯示人物和人物關(guān)系的搜索結(jié)果;
所述語料數(shù)據(jù)包括第三方描述數(shù)據(jù)和人物語言數(shù)據(jù),第三方描述數(shù)據(jù)是指以第三人稱的方式對(duì)人物進(jìn)行描述的語料數(shù)據(jù),人物語言數(shù)據(jù)是指人物在社交媒體上以第一人稱的方式發(fā)表的一些互動(dòng)語言或者觀點(diǎn)看法;
所述非直觀畫像包括基于關(guān)系嵌入方法的非直觀畫像或是基于向量差方法的非直觀畫像;所述直觀畫像是基于主題詞方法的直觀畫像。
2.根據(jù)權(quán)利要求1所述的基于多元化關(guān)系畫像技術(shù)的在線社會(huì)關(guān)系搜索方法,其特征在于,所述語料數(shù)據(jù)是第三方描述數(shù)據(jù)或是人物語言數(shù)據(jù),針對(duì)指定的語料數(shù)據(jù)基于關(guān)系嵌入方法得到的人物A和人物B之間人際關(guān)系的非直觀畫像,包括以下步驟:
1)定義語料數(shù)據(jù)集的最小語料單位,其中,第三方描述數(shù)據(jù)的最小語料單位為段落,人物語言數(shù)據(jù)的最小語料單位為一次互動(dòng)語言;
2)對(duì)語料數(shù)據(jù)集進(jìn)行分詞處理,分詞時(shí)將人物A的名稱和人物B的名稱加入到分詞詞典中,確保人物A的名稱和人物B的名稱被分割成獨(dú)立的詞語;
3)在語料數(shù)據(jù)集中找到同時(shí)出現(xiàn)人物A和人物B的所有最小語料單位,構(gòu)成集合w;
4)定義人物A和人物B的關(guān)系為字符串A-B,將所述關(guān)系A(chǔ)-B以步長2n等距離嵌入到集合w中的每個(gè)最小語料單位中,不夠2n整數(shù)倍的最后一次嵌入直接將關(guān)系A(chǔ)-B嵌入到最小語料結(jié)尾處;
5)使用word2vec方法,設(shè)置詞向量窗口大小為n,對(duì)嵌入關(guān)系A(chǔ)-B后的語料數(shù)據(jù)集進(jìn)行訓(xùn)練,從而生成詞向量文件;
6)在詞向量文件中找到與關(guān)系A(chǔ)-B對(duì)應(yīng)的向量作為描述人物A和人物B的關(guān)系的向量,即為人物A和人物B之間人際關(guān)系的非直觀畫像。
3.根據(jù)權(quán)利要求1所述的基于多元化關(guān)系畫像技術(shù)的在線社會(huì)關(guān)系搜索方法,其特征在于,所述語料數(shù)據(jù)為第三方描述數(shù)據(jù),針對(duì)指定的第三方描述數(shù)據(jù)基于向量差方法得到的人物A和人物B之間人際關(guān)系的非直觀畫像,包括以下步驟:
1)對(duì)包含有人物A和人物B的語料數(shù)據(jù)文件進(jìn)行分詞處理,分詞時(shí)將人物A的名稱和人物B的名稱加入到分詞詞典中,確保人物A的名稱和人物B的名稱被分割成獨(dú)立的詞語;
2)利用word2vec方法,對(duì)分詞后的包含有人物A和人物B的語料數(shù)據(jù)文件進(jìn)行訓(xùn)練獲得相應(yīng)的詞向量文件;
3)搜索該詞向量文件,分別獲得人物A的名稱和人物B的名稱對(duì)應(yīng)的詞向量,其中,
人物A的名稱對(duì)應(yīng)的詞向量記為:
vA=(d1,d2,...,d100)
人物B的名稱對(duì)應(yīng)的詞向量記為:
vB=(p1,p2,...,p100)
定義人物A和人物B的關(guān)系為字符串A-B,將所述關(guān)系A(chǔ)-B表示為向量:
vA-B=(d1-p1,d2-p2,...,d100-p100)
定義關(guān)系A(chǔ)-B的關(guān)系強(qiáng)度為:
-|vA-B|
定義關(guān)系A(chǔ)-B的關(guān)系相似度為向量vA和向量vB的余弦值,該余弦值越大,則關(guān)系A(chǔ)-B關(guān)系類型相似度越高,反之相似度越低。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010153660.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類裝置和實(shí)體關(guān)系分類方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開關(guān)系統(tǒng)
- 視頻視覺關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開關(guān)系統(tǒng)
- 用戶畫像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫像聯(lián)動(dòng)方法及系統(tǒng)
- 畫像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫像系統(tǒng)及其構(gòu)建方法
- 用戶畫像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場(chǎng)景畫像構(gòu)建方法和裝置
- 一種用戶畫像方法與裝置





