[發明專利]一種基于彈幕數據分析的廣告投放方法有效
| 申請號: | 201810882914.3 | 申請日: | 2018-08-06 |
| 公開(公告)號: | CN109308487B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 趙欽佩;饒衛雄;史揚;李江峰 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/284;G06F40/247;G06Q30/02 |
| 代理公司: | 上海科律專利代理事務所(特殊普通合伙) 31290 | 代理人: | 葉鳳 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 彈幕 數據 分析 廣告 投放 方法 | ||
1.一種基于彈幕數據分析的廣告投放方法,其特征在于,
步驟1、彈幕數據預處理
彈幕數據預處理過程包括分詞、過濾詞性以及過濾停用詞;
步驟2、特征值提取
步驟2.1、主題提取
步驟2.1.1、經過步驟1的預處理后的彈幕數據首先構造彈幕詞典,在詞典的基礎上構建語料庫;
步驟2.1.2、計算詞頻-逆向文件頻率tf-idf來訓練LDA模型,以此獲得主題類別;
步驟2.2、情感分析
采用了常見的情感詞典庫和網絡彈幕用詞詞典庫結合的方式,通過將含有情感傾向的詞匯本身、詞匯情感傾向、詞性種類、情感強度進行計算和統計,進而得到每個彈幕句子的情感狀況;考慮七大類情感,分別是樂、好、怒、哀、懼、惡、驚;其中,樂、好兩個情感屬于正向情感,怒、哀、懼、惡、驚五個情感屬于負向情感;
所述計算和統計,具體做法:將每條彈幕評論數據分詞后的詞匯與情感詞典進行匹配,識別情感詞,情感詞典中每個情感詞對應相應情緒的情感值,實際操作中需要結合情感詞和程度副詞來計算相應情感的情感值,再按照不同情感類別進行統計求和,計算出單條彈幕中每種情感的情感值之和,即得到此彈幕的七種情感值,用這七種情感值組成一個七維的向量,稱之為情感向量;
每個用戶發表的彈幕所計算出來的主題類別及情感向量即為特征值;
步驟3、突變點分析
步驟3.1、第一個過程中根據個體在時間軸的分布得到的個體-時間矩陣尋找到時間軸上的突變點;
首先輸入包括一個視頻的彈幕數據特征矩陣D(N,T)以及一個大小w的窗口;以窗口大小w在時間軸上從最初時間點滑動,假設時間軸上共有T個時間點,則滑動的次數為T-w+1次;每次滑動窗口會得到一個w*N的矩陣,對這個矩陣中的每一對用戶,計算皮爾森相關系數:
其中,x,y分別代表兩個用戶對應的向量,cov(x,y)為協方差,σ為方差,μx和μy分別代表x和y的期望值,E[]代表對括號內的內容求期望值;
通過計算兩兩個體之間皮爾森相關系數ρx,y,構建出一個對稱矩陣C,矩陣C中的每一個元素為:
Cx,y=ρx,y (2)
得到C矩陣后需要計算出該矩陣的主特征向量,主特征向量中的每一個元素的值可以反映該用戶的“活躍”度,即如果這個用戶與大多數其它用戶的相關性越好則這個用戶越“活躍”,對應的元素的值也就越大;對于每一個C矩陣,都會得到一個主特征向量,在窗口滑動完畢之后,得到全部的C矩陣與對應的主特征向量;對于t時間點對應的窗口,有一個C矩陣與主特征向量與之對應,該主特征向量記為u(t),計算其t時間點前w’時間段內的主特征向量的平均值,記為r(t-1),即:
得到了u(t)與r(t-1)之后,以Z值衡量t時刻的變化,Z值的計算方式如下:
Z=1-uTr (4)
r是r(t-1),u則是u(t);
如果u(t)與r(t-1)完全相同,則Z值為0,如果u(t)與r(t-1)完全成直角,即完全不同,則Z值為1,Z值的取值范圍介于0和1之間,Z值越大表示在對應的t時間點的變化越明顯,反之,Z值越小說明對應的t時間點的變化越不明顯;
得到了每個時間點的Z值之后,找出時間軸上Z值最大的幾個點,這些點代表著時間軸上在這些時間點處的變化最為明顯,在實際應用領域中代表著異常點值得關注的變化時間點;
步驟3.2、第二個過程是根據步驟3.1中找到的突變點分析是哪些彈幕個體的變化最大程度地造成了突變時間點的變化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810882914.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





