[發(fā)明專利]一種數(shù)據(jù)關(guān)聯(lián)性的確定方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610261025.6 | 申請(qǐng)日: | 2016-04-22 |
| 公開(公告)號(hào): | CN107305639A | 公開(公告)日: | 2017-10-31 |
| 發(fā)明(設(shè)計(jì))人: | 楊連群;溫晉英;劉樹發(fā) | 申請(qǐng)(專利權(quán))人: | 楊連群 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 北京華睿卓成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11436 | 代理人: | 程淼 |
| 地址: | 300450 天津市濱海新區(qū)*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 關(guān)聯(lián)性 確定 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)關(guān)聯(lián)性的確定方法。
背景技術(shù)
聚類分析是根據(jù)對(duì)象之間的相似度將對(duì)象劃分成不同的簇,使得同一簇內(nèi)的對(duì)象相似度最大化,而不同簇之間的對(duì)象相似度最小化。
聚類分析中的圖聚類是指把圖分成互不相交的一些子圖,使得同一子圖內(nèi)的節(jié)點(diǎn)具有較高的緊密性,而子圖之間的各節(jié)點(diǎn)緊密性較低。一個(gè)圖通常表示為G=(V,E,W),其中V是節(jié)點(diǎn)的集合,E是邊的集合,W是邊權(quán)重。圖聚類問題就是把圖G劃分成K個(gè)互不相交的子圖Gi=(V,E,W),i=1,2,…,K。現(xiàn)有技術(shù)中的圖聚類方法存在以下不足之處:1)分割質(zhì)量不夠高,易產(chǎn)生小聚類;2)計(jì)算速度較慢等問題.
發(fā)明內(nèi)容
本發(fā)明的主要目的在于克服上述現(xiàn)有技術(shù)的缺陷,提供了一種數(shù)據(jù)關(guān)聯(lián)性的確定方法,以解決現(xiàn)有技術(shù)中數(shù)據(jù)關(guān)聯(lián)性確定過程中速度較慢,聚類質(zhì)量不夠高的缺陷,在能夠提供高質(zhì)量的聚類結(jié)果的同時(shí),保證了較快的處理速度。
本發(fā)明一方面提供一種數(shù)據(jù)關(guān)聯(lián)性的確定方法,包括以下步驟:
第一步,對(duì)圖G的數(shù)據(jù)進(jìn)行聚類,獲得N個(gè)簇,G‘={G’i},i=1,2,…,N;
第二步,對(duì)獲得的所述N個(gè)簇,進(jìn)行歸并,生成K個(gè)簇,K<N;
其中,第一步進(jìn)一步包括以下步驟:
第1.1步,計(jì)算圖G的鄰接矩陣A;
第1.2步,對(duì)每個(gè)節(jié)點(diǎn)添加自環(huán),即A′:=A+I,;其中,I為對(duì)角線元素為1的對(duì)角矩陣;
第1.3步,計(jì)算轉(zhuǎn)移概率矩陣M:
M(i,j)代表節(jié)點(diǎn)vi到節(jié)點(diǎn)vj的轉(zhuǎn)移概率;
第1.4步,M進(jìn)行擴(kuò)展參數(shù)為e的擴(kuò)展操作,其中,e為大于1的正整數(shù),得到矩陣M1;
M1=Mexp=Expand(M,e)=Me
第1.5步,對(duì)M1進(jìn)行膨脹參數(shù)為r的膨脹操作,膨脹參數(shù)r為正實(shí)數(shù),得到矩陣M2;
重復(fù)執(zhí)行步驟1.4、步驟1.5,直至矩陣M2不發(fā)生變化,此時(shí)生成穩(wěn)定的轉(zhuǎn)移矩陣M2;
第1.7步,對(duì)穩(wěn)定的轉(zhuǎn)移矩陣M2并進(jìn)行歸類,獲得N個(gè)簇。
可選的,其中所述第1.7步對(duì)穩(wěn)定的轉(zhuǎn)移矩陣M2并進(jìn)行歸類具體為,對(duì)于M2中的每一行,將吸引節(jié)點(diǎn)與被吸引節(jié)點(diǎn)歸為一類。
可選的,其中所述重復(fù)執(zhí)行步驟1.4、步驟1.5之前,將M2中的每列中接近零值的元素移除。
可選的,所述第二步具體為:
第2.1步,針對(duì)N個(gè)簇中的每個(gè)簇G’i,計(jì)算與其鄰近的每個(gè)簇G’j之間的相似度;
其中,RC為簇之間的近似度,RI為簇之間的互連度;α是互連度的重要度參數(shù);
其中,|G’i|表示簇G’i內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù);EC(G’i)表示簇G’i內(nèi)所有邊的權(quán)重和;EC(G’i,G’j)表示連接兩個(gè)簇的所有邊的權(quán)重和;
第2.2步,針對(duì)G’i,獲得與其所有鄰近簇之間的相似度中的最大值Sim_max;
第2.3步,判斷相似度中的最大值Sim_max是否超過第一閾值,若判斷結(jié)果為是,則G’i與該最大值對(duì)應(yīng)的簇進(jìn)行合并;若判斷結(jié)果為否,則將G’i從G‘集合中移除,將其加入結(jié)果簇G={G1,G2,…,GK}中;
第2.4步,重復(fù)第2.1步至第2.3步直至G‘集合中為空。
可選的,所述第二步具體為:
第2.1步,針對(duì)N個(gè)簇中的每個(gè)簇G’i,計(jì)算與其鄰近的每個(gè)簇G’j之間的近似度RC以及互連度RI;
其中,|G’i|表示簇G’i內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù);EC(G’i)表示簇G’i內(nèi)所有邊的權(quán)重和;EC(G’i,G’j)表示連接兩個(gè)簇的所有邊的權(quán)重和;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于楊連群,未經(jīng)楊連群許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610261025.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 不明確地理引用的分類
- 一種基于網(wǎng)頁(yè)關(guān)聯(lián)性的釣魚檢測(cè)方法
- 關(guān)聯(lián)性分析裝置、關(guān)聯(lián)性分析方法及關(guān)聯(lián)性分析程序
- 決定具有最佳聚焦深度照明光源的方法
- 無(wú)線節(jié)點(diǎn)的關(guān)聯(lián)性架構(gòu)及其最佳化方法
- 確定用戶標(biāo)識(shí)的關(guān)聯(lián)性的方法和裝置
- 基于對(duì)象關(guān)聯(lián)性評(píng)估的云存儲(chǔ)方法及裝置
- 基于運(yùn)行參數(shù)關(guān)聯(lián)性分析的工業(yè)過程異常工況預(yù)測(cè)方法
- 訪問程序關(guān)聯(lián)性隔離器的方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于移動(dòng)區(qū)間關(guān)聯(lián)性趨勢(shì)的預(yù)警閾值設(shè)置方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





