[發明專利]一種基于社交網絡原理的詞匯社交網絡分析方法有效
| 申請號: | 201710936365.9 | 申請日: | 2017-10-10 |
| 公開(公告)號: | CN107783948B | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 王峰;杭波;谷瓊;吳中博;屈俊峰;趙永標 | 申請(專利權)人: | 湖北文理學院 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F40/117;G06Q50/00 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 441053 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 網絡 原理 詞匯 網絡分析 方法 | ||
1.一種基于社交網絡原理的詞匯社交網絡分析方法,其特征在于,包括以下步驟:
步驟1:首先定義詞匯關系、平行關系、隸屬關系、詞匯節點對的社交角色、貢獻型詞匯、索取型詞匯、孤島型詞匯、詞匯網絡結構、擴張型詞匯網絡、萎縮型詞匯網絡、平衡型詞匯網絡、孤立型詞匯網絡;
所述詞匯關系,描述以詞匯屬性為網絡節點、以上下文語義為邊所構成的詞匯社交網絡中各節點間的關系,記為關系R;詞匯社交網絡關系R包括:平行關系Rp和隸屬關系Ra;其中,平行關系Rp包括直接關聯關系Rdc和間接關聯關系Ric;R=Rp∪Ra,Rp=Rdc∪Ric;
所述平行關系,表明詞匯社交網絡中的某兩個詞匯節點所構成的節點對之間的關系平等且相關,記為Rp;其中,語義關系之間具有明確指代關系的節點對具有直接關聯關系,否則具有間接關聯關系;
所述隸屬關系,表明詞匯社交網絡中的某兩個詞匯節點所構成的節點對之間存在依賴關系,記為Ra;
所述詞匯節點對的社交角色,在詞匯社交網絡中,節點對間存在包括貢獻、索取和孤立在內的“社交行為”;
所述貢獻型詞匯,用于形容、修飾或連接其它詞匯,并專為其它詞匯服務的詞匯節點,記為Vc;
所述索取型詞匯,以被服務的詞匯形式存在,記為Va;
所述孤島型詞匯,與其它任何詞匯間鮮有交互,這類詞匯通常表現為生僻字或生僻詞,記為Vi;
所述詞匯網絡結構,用于描述隨時間變化的詞匯社交網絡的變化趨勢,記為Vns;詞匯網絡結構包括:擴張型詞匯網絡Vns-e、萎縮型詞匯網絡Vns-a、平衡型詞匯網絡Vns-p和孤立型詞匯網絡Vns-i,Vns={Vns-e,Vns-a,Vns-p,Vns-i};
所述擴張型詞匯網絡,表明在特定時間段內,某詞匯社交網絡的變化趨勢為擴張狀態;其直接變現為該詞匯社交網絡中的節點數目在此段時間段內增多;
所述萎縮型詞匯網絡,表明在一定時間段內,某詞匯社交網絡的變化趨勢為萎縮狀態;其直接變現為該詞匯社交網絡中的節點數目在此段時間段內減少;
所述平衡型詞匯網絡,表明在一定時間段內,某詞匯社交網絡的變化趨勢為平衡狀態;其直接表現為該詞匯社交網絡中的節點數目在此段時間段內保持不變;
所述孤立型詞匯網絡,表明在一定時間段內,某詞匯社交網絡與其它社交網絡之間暫無交互行為;其直接表現為詞匯社交網絡中的所有節點在此段時間段內僅存在內部節點交互行為,而暫無任何外部交互;
步驟2:構造詞匯社交網絡;
步驟2的具體實現包括以下子步驟:
步驟2.1:首先對文本根據上下文語義進行拆分,形成單個詞匯組合;
步驟2.2:刪除與詞匯社交網絡構建無關的詞匯;
步驟2.3:對文本內容進行標注和排序;
步驟2.4:將對已標注的文本內容進行編碼;
步驟2.4中,是基于流量樹對已標注的文本內容進行編碼,所述流量樹是在層次樹的結構中加入流量信息,流量的方向即層次樹中的實線箭頭所指方向,同一層次的不同詞匯節點若存在關聯關系采用虛線進行連接;
步驟3:詞匯社交網絡的相關計算;
步驟3的具體實現包括以下子步驟:
步驟3.1:定義流量樹、遍歷模式、核心節點、度與詞匯社交網絡、子網類型;
所述流量樹,記為T,用進行表示;其中,i表示樹中詞匯節點的編號,j表示樹中詞匯節點所在的層次,M表示遍歷流量樹的模式;
所述遍歷模式包括順序模式、逆序模式和隨機模式;所述順序模式,按編號增序進行遍歷;所述逆序模式,按編號減序進行遍歷;所述隨機模式R,按編號隨機進行遍歷;其中,隨機模式的訪問方式由隨機函數確定,N表示隨機函數計算所得的節點編號,rand(0,1)表示計算機隨機產生的0-1之間的隨機數,Nmax和Nmax分別表示遍歷編號的最大節點編號和最小節點編號;
所述核心節點,為詞匯社交網絡中各節點度數中的極大值節點;其中,極值下限由閾值進行確定,即節點度數大于閾值的節點均可被認定為核心節點;而通過核心節點的數目可確定詞匯社交網絡中的子網劃分規則,其中,閾值記為Vd-γ;
所述度與詞匯社交網絡,詞匯社交網絡中節點的度分為入度和出度,利用入度和出度的比例可確定不同的子網類型;其中,入度和出度分別記為Vd-in和Vd-out;
所述子網類型,用于描述詞匯社交網絡中各子網內部的核心節點的入度和出度的比例情況;
步驟3.2:核心節點度與詞匯社交網絡中子網類型確定;
具體包括以下子步驟:
步驟3.2.1:通過計算節點的度并結合度的閾值設定來確定核心節點;
步驟3.2.2:根據核心節點的個數來確定子網的個數,有多少個核心節點就劃分多少個子網;
步驟3.2.3:在確定子網個數之后,分別計算各子網中核心節點的入度和出度,根據入度出度的比值來確定詞匯社交網絡中各子網的類型,將子網內部的入度出度比記為將子網間的入度出度比記為
由核心節點的入度出度比來確定詞匯社交網絡中的子網類型,孤島型除外的子網類型的分類規則如下公式(1)所示:
孤島型除外的子網類型的分類規則通過計算子網間的入度出度比實現,子網間的入度出度比如下公式2所示:
其中,IW為入度出度比的計算標識,意為子網間入度出度比;i為節點編號,n為參與計算的網間子網節點的數目;若其中和分別表示參與計算的網間節點的入度和與出度和,則表明某子網與其它子網之間無任何交互行為,由此便可認定該子網為孤島型;
通過子網內的交互度求和的變化量來確定子網的發展變化趨勢,其中子網內的入度出度比如公式(3)所示:
其中,NW為入度出度比的計算標識,意為網內入度出度比,j為節點編號,m為參與計算的網內子網節點的數目;
子網的發展變化趨勢確定規則如下公式(4)所示:
若其中和分別表示參與計算的網間節點的入度和與出度和,由此則表明某子網與其它子網在某時間段(t1-t2)之間無任何交互行為,由此便可認定該子網的發展趨勢為孤立型子網。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北文理學院,未經湖北文理學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710936365.9/1.html,轉載請聲明來源鉆瓜專利網。





