[發明專利]基于隨機游走的多標簽屬性值劃分方法和裝置在審
| 申請號: | 201910271878.1 | 申請日: | 2019-04-04 |
| 公開(公告)號: | CN109934306A | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | 溫柳英;袁偉;閔帆 | 申請(專利權)人: | 西南石油大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 610500 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽屬性 隨機游走 方法和裝置 無向加權圖 樣本集合 樣本 標簽 構建 聚類 轉換 分類 | ||
1.一種基于隨機游走的多標簽屬性值劃分方法,其特征在于,包括:
將樣本集合中樣本的屬性值轉換為符號型屬性值;
確定所述樣本集合中每一個所述樣本包含的標簽;
基于所述標簽和所述符號型屬性值,為同一類的所述符號型屬性值構建無向加權圖;
基于隨機游走,對所述無向加權圖進行聚類。
2.根據權利要求1所述的基于隨機游走的多標簽屬性值劃分方法,其特征在于,在所述確定所述樣本集合中每一個所述樣本包含的標簽之后,在所述為同一類的所述符號型屬性值構建無向加權圖之前,進一步包括:
針對每一個所述樣本,執行:將所述樣本對應的所有標簽,關聯至所述樣本對應的每一個所述符號型屬性值;
所述為同一類的所述符號型屬性值構建無向加權圖,包括:
根據關聯的結果,為同一類的所述符號型屬性值構建無向加權圖。
3.根據權利要求2所述的基于隨機游走的多標簽屬性值劃分方法,其特征在于,所述根據關聯的結果,為同一類的所述符號型屬性值構建無向加權圖,包括:
針對同一類的所述符號型屬性值,執行:
初始化無向加權圖;
從所述樣本集合包含的所有的所述標簽中,選定一個標簽為當前標簽,并循環執行下述N1至N8;
N1:確定所述當前標簽關聯的目標符號型屬性值;
N2:計算所述目標符號型屬性值的初始概率,并為所述目標符號型屬性值去重,當去重后的目標符號型屬性值的個數的大于預設數量時,執行N3,當去重后的目標符號型屬性值的個數不大于預設數量時,執行N4;
N3:按照所述初始概率的降序順序,從去重后的目標符號型屬性值中,為所述初始化無向加權圖選定預設數量的節點屬性值,其中,所述預設數量不小于3,并執行N5;
N4:將去重后的目標符號型屬性值直接作為節點屬性值;
N5:判斷選定的所述節點屬性值是否已經存在于所述無向加權圖中,如果是,則執行N7;否則,執行N6;
N6:將所述節點屬性值添加到所述無向加權圖中;
N7:計算與所述當前標簽相關的每兩個所述節點屬性值之間的邊權重,并將所述邊權重添加到所述無向加權圖中;
N8:判斷所述樣本集合包含的所有的標簽中是否存在未被選定過的標簽,如果是,則從未被選定過的標簽中,選定一個標簽為當前標簽,執行N1;否則,結束循環流程。
4.根據權利要求3所述的基于隨機游走的多標簽屬性值劃分方法,其特征在于,
所述計算所述目標符號型屬性值的初始概率,包括:
利用下述初始概率計算公式,計算所述目標符號型屬性值的初始概率,
初始概率計算公式
其中,Pd(t)表征當前標簽d關聯的目標符號型屬性值t的初始概率;ct表征在當前標簽d下,目標符號型屬性值t出現的次數;Cd表征當前標簽d關聯的目標符號型屬性值的總個數;
和/或,
所述計算與所述當前標簽相關的每兩個所述節點屬性值之間的邊權重,包括:
利用下述邊權重計算公式,計算與所述當前標簽相關的每兩個所述節點屬性值之間的邊權重;
所述邊權重計算公式:
Q(vu)n=Q(vu)n-1+Pd(v)×Pd(u)
其中,Q(tu)n表征與所述當前標簽相關的兩個目標符號型屬性值v和u分別對應的節點屬性值在所述無向加權圖中第n次出現時,v和u分別對應的節點屬性值之間的邊權重;Pd(v)表征當前標簽關聯的目標符號型屬性值v的初始概率;Pd(u)表征當前標簽關聯的目標符號型屬性值u的初始概率,且,當n=1時,Q(vu)n-1=0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南石油大學,未經西南石油大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910271878.1/1.html,轉載請聲明來源鉆瓜專利網。





