[發明專利]群體關系類型識別方法及裝置有效
| 申請號: | 201710007933.7 | 申請日: | 2017-01-05 |
| 公開(公告)號: | CN108280458B | 公開(公告)日: | 2022-01-14 |
| 發明(設計)人: | 張宗一;張功源;張曉敏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;賈允 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 群體 關系 類型 識別 方法 裝置 | ||
1.一種群體關系類型識別方法,其特征在于,所述方法包括:
接收群體關系類型識別請求,所述群體關系類型為該群體內成員的關系類型;
獲取與所述群體關系類型識別請求相對應的群體信息,所述群體信息包括群體成員信息;
根據預定義的目標數據字段,從所述群體成員信息中提取群體中每個成員對應的目標數據,將所述群體成員按圈子歸屬度降序排列,組成個人數據集;其中,所述圈子歸屬度=(節點圈子內的度/節點在原圖中的度)*(節點圈子內的度/圈子子圖最大度),節點圈子內的度表示該節點在該圈子中的連接數,節點在原圖中的度表示該節點在全局網絡中的連接數,圈子子圖最大度表示該圈子中圈內連接最多的節點的圈內連接數;
將所述個人數據集輸入群體分類深度神經網絡模型,所述群體分類深度神經網絡模型根據所述預定義的目標數據字段訓練得到,群體分類深度神經網絡模型使用CNN模型架構得到,CNN模型的架構包含依次設置的神經網絡的輸入層、2D卷積層、神經元的激活函數層、二維數據的操作層、防止過擬合的層、2D卷積層、神經元的激活函數層、二維數據的操作層、防止過擬合的層、將二維數組展平成一維的層、全連接層、防止過擬合的層、全連接層;
根據所述群體分類深度神經網絡模型的輸出結果,確定所述群體的關系類型;
其中,在將所述個人數據集輸入群體分類深度神經網絡模型之前還包括訓練群體分類深度神經網絡,包括:
獲取待訓練的關系類型樣本數據;
根據神經網絡的所有權重和損失函數,采用反向傳播法得到損失函數的梯度;
根據所述梯度,采用隨機梯度下降法,更新神經網絡的權重;
將更新的權重進行預設次數的迭代,以最小化損失函數;
通過獲取關系類型樣本數據中用戶的目標數據字段,并根據損失函數,對所述群體分類深度神經網絡進行訓練,得到群體分類深度神經網絡模型;
所述獲取待訓練的關系類型樣本數據包括:
獲取同一個群體內一個用戶對另一用戶的備注標簽,遍歷所有備注標簽,將所述備注標簽與預設的關系標簽進行匹配,將匹配結果作為兩個用戶之間的打標標簽;
對打標標簽進行分類,并統計數量最多的打標標簽作為目標標簽,所述目標標簽映射該群體的關系類型。
2.根據權利要求1所述的方法,其特征在于,所述群體關系類型識別請求的觸發條件包括以下條件的一個或多個:
所述群體創建成功;
所述群體成員數量達到觸發閾值;
所述群體內成員交流熱度達到觸發熱度值;
啟動人工觸發。
3.根據權利要求1所述的方法,其特征在于,所述獲取待訓練的關系類型樣本數據還包括篩選群體:若一個群體中數量最多的打標標簽數量超過打標標簽總數的一半,且具有目標標簽的用戶數量超過預設數量閾值,則將該群體納入關系類型樣本,否則,拋棄該群體數據。
4.根據權利要求1所述的方法,其特征在于,所述預設的關系標簽數量為多個,將所述備注標簽與預設的關系標簽進行匹配包括:
針對每一個關系標簽建立關鍵詞詞庫,對所述備注標簽進行分詞,將分詞結果與詞庫中的關鍵詞進行比對,若分詞結果與關鍵詞匹配,則所述備注標簽與該關鍵詞所在詞庫所對應的關系標簽匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710007933.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于離散度平衡的度量學習方法
- 下一篇:圖片的處理方法、裝置及系統





