[發明專利]一種基于關聯分析的異構媒體相似性計算方法和檢索方法有效
| 申請號: | 201410356922.6 | 申請日: | 2014-07-24 |
| 公開(公告)號: | CN104199826B | 公開(公告)日: | 2017-06-30 |
| 發明(設計)人: | 彭宇新;翟曉華 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 余功勛 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關聯 分析 媒體 相似性 計算方法 檢索 方法 | ||
1.一種基于關聯分析的異構媒體相似性計算方法,包括以下步驟:
(1)建立包含不同媒體類型的異構媒體數據庫,并將所述數據庫分為訓練集和測試集,提取每種媒體類型數據的特征向量;
(2)基于媒體內部關聯關系,通過近鄰分析計算不同媒體的內容相似性;
(3)基于媒體之間關聯關系,通過異構媒體約束傳遞計算不同媒體的內容相似性;該步驟通過建立不同媒體之間的語義關聯關系,基于媒體數據的數據分布進行異構媒體約束傳遞,從而獲得測試集上不同媒體類型數據之間的關聯關系,作為其相似性;
(4)通過自適應排序結果融合算法融合媒體內部和媒體之間的內容相似性獲得最終的相似性計算結果。
2.如權利要求1所述的方法,其特征在于,所述步驟(1)不同媒體類型為文本和圖像,對于文本數據,提取其隱狄雷克雷分布特征向量;對于圖像數據,提取其詞袋特征向量。
3.如權利要求2所述的方法,其特征在于,所述步驟(2)中基于媒體內部關聯關系的相似性計算方法,通過分析兩個媒體數據的k近鄰,以兩個媒體數據屬于同一類別的概率作為其相似性。
4.如權利要求3所述的方法,其特征在于,所述步驟(2)中任意兩個媒體數據之間相似性計算方法為:
其中,xi,yj表示文本和圖像對應的特征向量,li,lj分別表示xi,yj的類別標簽,l表示類別集合中的任一種類別,Nk(o)表示媒體數據o的k近鄰,x表示k近鄰集合中的一個媒體數據,σ(z)=(1+exp(-z))-1為sigmoid函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410356922.6/1.html,轉載請聲明來源鉆瓜專利網。





