[發明專利]一種基于多模態自適應社會關系強度挖掘的社會搜索方法無效
| 申請號: | 201210535907.9 | 申請日: | 2012-12-12 |
| 公開(公告)號: | CN103020221A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 徐常勝;桑基韜 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多模態 自適應 社會關系 強度 挖掘 社會 搜索 方法 | ||
1.一種基于多模態自適應社會關系強度挖掘的社會搜索方法,該方法包括步驟如下:
步驟1:收集用戶上傳的圖片信息以及與其有單向社會關系的用戶,每個用戶對應一個由上傳圖像集合、圖像標注集合和與其有單向社會關系的關系用戶集合組成的三元組;
步驟2:根據輸入的三元組,建立多模態概率生成式模型,將所述圖像集合中的圖片內容和圖像標注集合中的圖像標注信息的生成過程進行推斷;
步驟3:根據推斷結果計算用戶主題空間和用戶主題分布,計算用戶與用戶之間的主題敏感的社會關系強度;
步驟4:根據所得到的用戶主題空間、用戶主題分布以及社會關系強度對搜索結果進行排序。
2.如權利要求1所述的方法,其特征在于,所述步驟1包括:
步驟11:對每個用戶u,根據其社會關系網絡采集與其有單向社會關系的用戶,組成集合Cu;
步驟12:對每個用戶u,采集其上傳的圖片,組成集合Du;
步驟13:對每個用戶u,采集其對所上傳的圖片添加的標注,組成集合Tu。
3.如權利要求1所述的方法,其特征在于,所述步驟2包括:
步驟21:建立主題敏感的多模態概率生成式模型,來模擬圖片和標注的生成過程;其中通過設置隱變量來描述建立多模態概率生成式模型的過程;其中,所述隱變量包括開關隱變量s、主題記錄隱變量z和采樣用戶隱變量c,所述開關隱變量s表示標注詞和圖像是用戶自發產生還是受關系用戶影響而產生的;所述主題記錄隱變量z表示采樣得到的主題;所述用戶隱變量c表示采樣得到的關系用戶;
步驟22:求解所述多模態概率生成式模型,其中通過吉布斯采樣推斷得到所述隱變量的取值。
4.如權利要求3所述的方法,其特征在于,所述步驟3包括:
步驟31:根據所獲得的所述隱變量的值計算主題空間Φ和用戶主題分布Ω;
步驟32:根據所述主題空間Φ和用戶主題分布Ω計算用戶與用戶之間的主題敏感的社會關系強度Ψ。
5.如權利要求1所述的方法,其特征在于,所述步驟4包括:
根據獲得的社會關系強度計算搜索到的圖片的相關性分數,所述相關性分數用于最終結果的排序,其中相關性分數的計算公式如下:
其中,q表示查詢詞,R(q,u,d)表示對搜索用戶u而言圖片d與查詢詞q的相關性,R(q,c,d)則表示對與搜索用戶u有單向社會關系的關系用戶c而言圖片d與查詢詞q的相關性,k表示第k個主題,Cu表示與用戶u有單向社會關系的關系用戶集合;Ψu,c(k)表示關系用戶c對用戶u的社會關系強度,p(Zk|q)表示查詢詞q的主題分布,其計算公式如下:
其中p(wi|Zk)表示標注詞wi在第k個主題中的概率,其根據所述用戶主題空間得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210535907.9/1.html,轉載請聲明來源鉆瓜專利網。





