[發明專利]一種基于用戶當前地理位置和物理環境的音樂推薦方法有效
| 申請號: | 201210349719.7 | 申請日: | 2012-09-20 |
| 公開(公告)號: | CN102890713A | 公開(公告)日: | 2013-01-23 |
| 發明(設計)人: | 陳珂;胡天磊;夏飛;壽黎但;陳剛 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 周烽 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 當前 地理位置 物理 環境 音樂 推薦 方法 | ||
技術領域
本發明涉及空間數據庫領域的索引機制與查詢方法,以及信息檢索領域針對海量多媒體對象的檢索推薦技術,尤其涉及一種基于用戶當前地理位置和物理環境的音樂推薦方法。
背景技術
在空間數據庫領域,為了快速、有效地訪問海量空間數據,專家學者提出了大量的空間索引方法,常見的索引方法包括網格(Grid)、四叉樹(Quad-Tree)、R-索引、R*樹索引、K-D-B樹索引、Hilbert曲線索引。在此基礎上,更提出了各種各具特色的查詢及其解決方案,如近鄰查詢、K近鄰查詢、連續近鄰查詢、反向近鄰查詢、最遠鄰居查詢、skyline查詢。這些空間索引通常以層次型的結構組織空間對象,從而支持高效的空間查詢。以被廣泛采用的R樹為例,空間上位置相近的數據點被聚類到最小包圍盒里,這些最小包圍盒又根據空間局部性遞歸的進行聚類,直到到達根節點。
在信息檢索領域,常見全文搜索引擎通常采用倒排文件(Inverted?File)對文檔對象進行索引,倒排文件以文檔關鍵詞作為索引,文檔作為索引對象建立關鍵詞-文檔映射結構。當用戶輸入關鍵詞進行檢索時,搜索引擎可以利用倒排文件高效地獲得包含此關鍵詞的文檔集合以及關鍵詞在各個文檔中出現的次數,從而便捷計算網頁文檔與用戶查詢之間的匹配程度,并按一定的排列順序返回查詢結果。現有的檢索系統最常用的模型是向量空間模型,在該模型中每個文檔d被映射為一個特征向量V(d)=(t1,t2,t3…tn),其中ti(i=1…n)為一列互不相同的Tag在文檔d中的權重,在信息檢索領域最常用的Tag權重計算方法為TF-IDF。使用向量空間模型就能計算任意文檔和用戶查詢之間的匹配度,首先把用戶查詢轉換成位于同一個文檔空間的向量,然后使用諸如余弦距離等計算函數計算匹配度。
在音樂推薦領域,根據方法的不同,傳統的音樂推薦系統大概可以分為兩類。一種是基于音樂內容(Content-Based)的,這種方法首先從用戶喜歡的音樂中提取出各種特征,然后根據這些特征運用機器學習的方法判斷用戶對于其他音樂的喜好程度;另一種是協同過濾(Collaborative-Filtering),它假設相似的用戶喜歡的音樂也是相似的,因此推薦給用戶的是其他有著相似興趣的用戶所喜歡的音樂。但是大多數的推薦系統并沒有考慮用戶當時所處的上下文環境,推薦出來的音樂并不能滿足用戶當時的心理需求,因為很多用戶其實是根據當時所處場合、發生事件或者物理環境狀況而不是歌手等來選擇音樂的。
發明內容
本發明的目的是克服現有技術的不足,提供一種基于用戶當前地理位置和物理環境的音樂推薦方法。
本發明的目的是通過以下技術方案來實現的:一種基于用戶當前地理位置和物理環境的音樂推薦方法,包括如下步驟:
(1)從照片網站爬取具有GPS信息的照片集;
(2)從音樂網站爬取包含歌詞等相關信息的音樂集;
(3)對步驟1)得到的具有GPS信息照片集建立空間索引,在此過程中對每張照片的原始Tag集進行分詞處理得到規范的照片Tag集;
(4)對步驟2)得到的包含歌詞等相關信息音樂集建立存儲索引,在此過程中對每首歌曲的歌詞進行分詞得到對應的音樂Tag集和相應的音樂文檔向量;
(5)分析文檔集得到一個Tag相似度矩陣;
(6)通過查詢步驟5)得到的Tag相似度矩陣將步驟3)得到的每張照片的Tag集轉換成位于音樂文檔向量空間的照片文檔向量;
(7)將步驟4)得到的音樂文檔向量和步驟6)得到的照片文檔向量用TF-IDF權重計算方式轉換成帶權音樂文檔向量和帶權照片文檔向量;
(8)客戶端接收用戶的當前位置信息和物理環境信息,傳遞給服務器進行計算;
(9)服務器根據從步驟8)得到的用戶位置信息通過步驟3)建立的照片集索引查詢出用戶位置包含的所有照片得到位置相關照片集,同時對從步驟8)得到的物理環境信息進行加強得到代表用戶當前物理環境的帶權Tag集;
(10)使用步驟9)得到的代表用戶物理環境的帶權Tag集對音樂進行過濾得到候選音樂集;
(11)根據步驟9)得到的位置相關照片集所包含的照片Tag集計算出代表用戶位置的帶權文檔向量,并用向量相似度計算方法計算出和其最匹配的K首音樂;
(12)基于步驟9)得到的位置相關照片集所包含的照片Tag集計算出相應的標簽云,最后將查詢出的K首音樂和生成的標簽云返回給客戶端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210349719.7/2.html,轉載請聲明來源鉆瓜專利網。





