[發(fā)明專利]作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011435954.7 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112231518B | 公開(公告)日: | 2021-04-06 |
| 發(fā)明(設(shè)計)人: | 石曉濤;潘軍;王哲;張國鑫;丁鵬;郭錚 | 申請(專利權(quán))人: | 南京訊思雅信息科技有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06F16/908 |
| 代理公司: | 南京睿之博知識產(chǎn)權(quán)代理有限公司 32296 | 代理人: | 劉菊蘭 |
| 地址: | 211100 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 作品 網(wǎng)絡(luò) 傳播 行為 發(fā)現(xiàn) 方法 系統(tǒng) 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì),系統(tǒng)包括作品登記管理模塊、平臺登記管理模塊、作品采集詞管理模塊、作品基礎(chǔ)過濾配置管理模塊、作品指紋過濾配置管理模塊、作品和平臺關(guān)系及過濾配置管理模塊和上傳人管理模塊等。本發(fā)明通過對作品、采集和審核進行管理,采用自動化采集方法,實現(xiàn)多作品全網(wǎng)傳播發(fā)現(xiàn)的數(shù)據(jù)并大幅降低數(shù)據(jù)遺漏,且通過采用數(shù)據(jù)清洗方法,能夠?qū)崿F(xiàn)對無關(guān)數(shù)據(jù)的識別提高數(shù)據(jù)有效性和清洗速度。本發(fā)明除適用影視作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)外,也適用文學(xué)作品、圖文作品、音樂作品等網(wǎng)絡(luò)傳播行為的發(fā)現(xiàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)信息采集技術(shù)領(lǐng)域,具體涉及一種作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)和流量變現(xiàn)市場的發(fā)展,市場上出現(xiàn)很多以視頻剪輯方式非法傳播影視作品的用戶平臺。雖然現(xiàn)在出現(xiàn)的很多數(shù)據(jù)采集系統(tǒng),以及各視頻平臺或搜索引擎也提供搜索能力,但是無法適用對于影視作品在網(wǎng)絡(luò)上傳播行為的發(fā)現(xiàn)。原因一是視頻平臺數(shù)據(jù)量巨大,不能進行全量采集與發(fā)現(xiàn),會出現(xiàn)大量數(shù)據(jù)遺漏問題;原因二是收集到的巨量數(shù)據(jù)存在大量無效數(shù)據(jù),雖然存在視頻指紋比對技術(shù)可實現(xiàn)數(shù)篩選,但是此技術(shù)對比速度隨作品量增加會線性增加,無法滿足龐大的視頻快速比對需求;原因三是對于大批作品的網(wǎng)絡(luò)傳播行為,全網(wǎng)發(fā)現(xiàn)工作沒有合適的自動化系統(tǒng),這些問題需要有相關(guān)技術(shù)或系統(tǒng)進行解決。
發(fā)明內(nèi)容
技術(shù)目的:為解決上述技術(shù)問題,本發(fā)明公開了一種作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì),能夠解決視頻網(wǎng)絡(luò)傳播行為的發(fā)現(xiàn)工作,同時盡量減少數(shù)據(jù)遺漏、大量無效數(shù)據(jù)的篩選難、大批量作品的網(wǎng)絡(luò)傳播行為快速發(fā)現(xiàn)及自動化實現(xiàn)等問題。
技術(shù)方案:為實現(xiàn)上述技術(shù)目的,本發(fā)明采用了如下技術(shù)方案:
一種作品網(wǎng)絡(luò)傳播行為發(fā)現(xiàn)方法,其特征在于,順序執(zhí)行以下步驟:
S1、配置規(guī)則:在本地數(shù)據(jù)庫中添加待檢索的作品信息、待搜索的多個網(wǎng)絡(luò)平臺信息、各網(wǎng)絡(luò)平臺中個人上傳者信息、多種過濾規(guī)則,過濾規(guī)則包括作品基礎(chǔ)過濾規(guī)則、作品指紋過濾規(guī)則、作品與平臺關(guān)系及其過濾規(guī)則;
S2、自動化數(shù)據(jù)采集:包括同時進行的任務(wù)生成線程和任務(wù)采集線程,任務(wù)生成線程中,生成用于實現(xiàn)數(shù)據(jù)采集的任務(wù)清單,任務(wù)清單中存儲實時更新的用于數(shù)據(jù)采集鏈接;由任務(wù)采集線程執(zhí)行任務(wù)清單,完成對作品網(wǎng)絡(luò)傳播行為的數(shù)據(jù)的采集,并逐個平臺制定具有預(yù)設(shè)內(nèi)容和顯示格式的視頻屬性信息;
S3、數(shù)據(jù)清洗:對步驟S2采集到的視頻屬性信息進行處理,將視頻屬性信息按照不同平臺進行解析和制定格式化鏈接;根據(jù)過濾規(guī)則,將篩選后的有效的格式化鏈接以清單形式輸出。
優(yōu)選地,步驟S1中,作品信息包括作品名稱、作品集數(shù)、作品導(dǎo)演、作品主演、作品編號、作品匹配用名稱正則的增刪改查、作品指紋特征、作品采集詞;對作品指紋特征的提取方法,包含sift算法、百度云視頻指紋算法或騰訊云視頻指紋算法;
網(wǎng)絡(luò)平臺信息包括平臺名稱、平臺編號、平臺網(wǎng)址、平臺采集入口鏈接、平臺搜索鏈接和平臺屬性;平臺屬性為從全網(wǎng)范圍內(nèi)篩選出的搜索引擎、視頻平臺或貼吧論壇中的任一種;個人上傳者信息包括上傳人首頁鏈接。
優(yōu)選地,所述步驟S2具體包括:
S2.1、初始化采集程序,同時啟動任務(wù)生成線程和任務(wù)采集線程;
S2.2、任務(wù)生成線程中,每隔固定時間,讀取網(wǎng)絡(luò)平臺信息及其對應(yīng)的平臺采集入口鏈接;
S2.3、任務(wù)生成線程中,設(shè)置第一采集時間間隔閾值,持續(xù)讀取作品采集詞信息,若當前采集時刻減去上次采集時刻大于第一采集時間間隔閾值,則將步驟S2.2的平臺采集入口鏈接和當前采集時刻讀取到的采集詞組合,得到一個新鏈接;
判斷所述新鏈接是否已存在于任務(wù)清單中,如果不存在,則加入到任務(wù)清單中,否則不處理;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京訊思雅信息科技有限公司,未經(jīng)南京訊思雅信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011435954.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





