[發明專利]一種音樂資源聚合搜索的方法在審
| 申請號: | 202111576096.2 | 申請日: | 2021-12-22 |
| 公開(公告)號: | CN114329136A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 陳婷婷;王明璐;陳虎 | 申請(專利權)人: | 南陽理工學院 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/953;G06F16/955;G06F16/958;G06F16/61;G06F16/632;G06F16/635;G06F40/279 |
| 代理公司: | 威海松柏知識產權代理事務所(普通合伙) 37372 | 代理人: | 戴立亮 |
| 地址: | 473000*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音樂 資源 聚合 搜索 方法 | ||
1.一種音樂資源聚合搜索的方法,其特征在于:包括如下步驟:
1)建立一個音樂資源聚合網站或音樂網絡聚和搜索平臺,所述該平臺或網站由用戶交互界面、搜索引擎模塊、音樂聚合模塊和網絡數據庫;
2)接收用戶輸入的音樂搜索關鍵詞,通過搜索引擎模塊對用戶搜索關鍵詞進行分詞處理,并通過建立好的條件建立搜索范圍,再通過音樂聚合模塊在網絡數據庫中進行音樂信息爬取;
3)音樂聚合模塊在爬取過程中根據關鍵詞對所述待爬取音樂信息進行篩選,并去除或者過濾掉重復的音樂信息,得到目標音樂信息,將爬取的音樂信息呈現給用戶。
2.根據權利要求1所述的音樂資源聚合搜索的方法,其特征在于,步驟二中,音樂信息爬取采用RSS網絡爬蟲設計,音樂信息爬取的過程,獲得初始網頁上的URL,在抓取網頁的過程中,根據一定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的URL隊列;然后,它將根據一定的搜索策略從隊列中選擇下一步要抓取的網頁URL,RSS爬蟲對鏈接進行解析,分辨出該網頁鏈接是否有新更新的內容,并重復上述過程,直到達到系統的某一條件時停止,對數據進行保存并統一建立全文倒排索引結束。
3.根據權利要求2所述的音樂資源聚合搜索的方法,其特征在于,所有被爬蟲抓取的網頁將會被系統存貯,進行一定的分析、過濾,并建立索引,以便之后的查詢和檢索。
4.根據權利要求1所述的音樂資源聚合搜索的方法,其特征在于,音樂聚合模塊從互聯網中收集了大量有關人機交互的音樂RSS數據源,并通過RSS爬蟲不斷地收集這些源的更新信息,同時還負責對所收集的信息進行分析,通過分類器將源和條目進行分類和標識。
5.根據權利要求1所述的音樂資源聚合搜索的方法,其特征在于,所述搜索引擎模塊運用了RSSearch搜索模型,RSSearch搜索模型模型包括Lucenemo模塊、TPRSS模塊和ItemScore模塊;Lucene模塊,該模塊主要負責處理用戶的搜索請求,將用戶輸入的搜索關鍵詞進行分詞,然后在已構建的索引中檢索相關文檔,最后得到與搜索關鍵詞相匹配的條目列表;TPRSS模塊,該模塊負責對系統中RSS數據源的質量進行評價,區分不同源之間的質量高低,最后得出源的評價分值,源的分值將直接影響搜索結果中條目的質量分值高低;ItemScore模塊,該模塊負責對Lucene模塊和TPRSS模塊分別所得的條目分值進行運算,得到條目的最終排序分值,該分值是搜索排序結果的依據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南陽理工學院,未經南陽理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111576096.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種工業油泥的處理方法
- 下一篇:一種關節軸承外徑檢測用裝置及方法





