[發明專利]一種基于多源信息融合分析的網絡視頻熱點事件發現方法有效
| 申請號: | 201610109051.7 | 申請日: | 2016-02-26 |
| 公開(公告)號: | CN105787049B | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 宋明黎;王燦;雷杰;張珂瑤;周星辰;卜佳俊 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78;G06F16/738;G06F16/36;G06K9/62 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信息 融合 分析 網絡 視頻 熱點 事件 發現 方法 | ||
1.一種基于多源信息融合分析的網絡視頻熱點事件發現方法,
包括如下步驟:
1)采集有多源信息的網絡視頻;
2)通過多源融合分析的視頻語義結構化模塊,將網絡視頻的多源信息結構化為描述性關鍵字標簽,實現網絡視頻語義結構化;
3)根據步驟2)得到的網絡視頻語義結構化關鍵字標簽與用戶定義的敏感詞字典的匹配度,得到網絡視頻的主觀敏感度參數;
4)根據網絡視頻中多源信息中的點擊率、時間字段,得到網絡視頻的客觀熱度參數;
5)根據步驟3)得到的主觀敏感度參數,建立網絡視頻敏感度預測模型,預測新網絡視頻的主觀敏感度;
6)根據步驟4)得到的客觀熱度參數,建立網絡視頻熱度預測模型,預測新網絡視頻的客觀熱度;
7)選取步驟5)得到的網絡視頻的主觀敏感度和步驟6)得到的網絡視頻的客觀熱度都大于一定閾值,并且主觀敏感度和客觀熱度加權求和在網絡視頻集中排名靠前的視頻作為熱點視頻,即網絡視頻熱點事件。
2.根據權利要求1所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:步驟1所述的多源信息包括網絡視頻的標簽、名稱、評論、時間和點擊率。
3.根據權利要求1所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:步驟2所述的多源融合分析的視頻語義結構化模塊,用于視頻摘要下載與多源文本信息摘要提取、視頻概念檢測與文本主題建模和視頻語義結構化。
4.根據權利要求3所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:所述的視頻摘要下載與多源文本信息摘要提取 一方面是指基于已有標注的訓練數據,通過視頻特征估計視頻中前景物體,然后用Gibbs采樣學習該前景在時間軸上的分布,從而計算前景在時域上對表現視頻內容的似然分布;當給定新的網絡視頻時,通過前景檢測獲得前景的起始時間,然后基于學習得到的時域似然分布,在最大似然的同時最小化視頻幀的數目,從而獲得對該視頻的摘要提取;另一方面,將非結構化的語義腳本進行信息摘要提取 ,用幾句話概括原本冗長的文字腳本;對此,采用課題組研發的基于語義重建的文本摘要技術,通過訓練文本的語義重建訓練獲得常用關鍵詞字典;給定新的文本數據時,基于訓練得到的關鍵詞字典對該文本數據進行語義重建,從而實現原始多源文本的摘要提取 ;系統通過時刻保持對視頻摘要數據和文本摘要數據的協同以獲得多源數據流摘要提取 之后的一致性。
5.根據權利要求3所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:所述的視頻概念檢測與文本主題建模是指將摘要下載的網絡視頻和與之匹配的文字腳本建模為語義單元的集合描述,以便于后續步驟對視頻和文本內容的結構化理解;具體包括首先構造視頻低層特征與視頻概念的支持向量機SVM判別式模型,基于大量的網絡視頻標注數據對各種視頻概念檢測SVM進行訓練;通過視頻概念檢測,可以排除大部分無用的視頻信息,關注于視頻中語義概念集中的部分,實現視頻的語義概念描述;然后,文本主題建模模塊采用隱狄利克雷話題模型LDTM,利用期望最大化算法得到模型的參數;將每個文本腳本表示成混合話題的分布;給定新的摘要文本時,利用訓練得到的話題分布進行文本主題建模,在此基礎上將結構化的文本話題與視頻語義概念檢測結果進行交叉驗證,確定網絡視頻最終的文本語義主題和視頻概念。
6.根據權利要求3所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:所述的視頻語義結構化是指在完成視頻概念檢測和文本主題建模之后,將網絡視頻相關聯的多源數據結構化為描述性關鍵字標簽,實現網絡視頻語義結構化。
7.根據權利要求1所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:步驟4所述的客觀熱度參數和包括網絡視頻的點擊率、擴散速度。
8.根據權利要求1所述的一種基于多源信息融合分析的網絡視頻熱點事件發現方法,其特征在于:步驟5所述的網絡視頻敏感度預測模型,是通過用戶定義的敏感詞字典構造敏感度圖譜,再基于該圖譜對匹配的敏感詞進行協同過濾打分,分數越高敏感度越高,反之越低。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610109051.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息推薦方法及裝置
- 下一篇:一種基于SOLR的關鍵字詞識別辦法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





