[發明專利]一種評估不同數據源數據準確度的方法和裝置在審
| 申請號: | 201611224252.8 | 申請日: | 2016-12-27 |
| 公開(公告)號: | CN106777235A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 易薇;郎曉鋒;顧石;張嘉亮 | 申請(專利權)人: | 天津數集科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司11246 | 代理人: | 龔燮英 |
| 地址: | 300457 天津市經濟技術開發區南*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 評估 不同 數據源 數據 準確度 方法 裝置 | ||
技術領域
本發明涉及互聯網廣告投放技術領域,特別是一種評估不同數據源數據準確度的方法和裝置。
背景技術
現在很多企業在互聯網平臺的不同媒體上投放廣告,為了提升廣告的投放效果、更好地完成營銷目標,通常會使用各數據源的人群標簽來進行定向投放。但來自不同數據源的人群標簽數據匹配度和準確度不一。目前,僅能通過廣告投放后第三方監測公司監測到的相關數據來了解各數據源人群標簽的情況。事實上,這種投放后才能得知數據匹配度和準確度情況的方式增大了企業的營銷成本。
中國發明專利CN 105989020 A公開了一種呼叫網絡多數據源匹配的方法,包括:獲取預設時間段內針對以預定電話號碼的呼叫日志;獲取預定時間段內針對一預定網絡的用戶訪問日志,預定網絡包括發布有預定廣告素材的網絡媒體和預定廣告素材所鏈接至的預定網站,且預定廣告素材和預定網站中均提示有預定電話號碼;根據呼叫日志與用戶訪問日志之間的關聯程度,為每條呼叫日志篩選出一條關聯程度最為緊密的用戶訪問日志,作為該呼叫日志對應的用戶訪問日志;根據每條用戶呼叫日志對應的用戶訪問日志中的URL或Refer URL,確定呼叫日志的來源網絡媒體;統計每個來源網絡媒體對應的會叫日志的數量。
發明內容
本發明需要解決的技術問題是提供一種評估各數據源數據準確度的方法和裝置。
為解決上述的技術問題,本發明的一種評估不同數據源數據準確度的方法,包括以下步驟,
步驟S101:數據采集,離線導入各數據源的人群標簽數據,統一數據格式并存儲;
步驟S102:數據驗證,根據設備ID與人群標簽的映射關系,基于可復核大數據樣本的設備ID與人群屬性,匹配、驗證得出標簽數據的準確度;
步驟S103:數據應用,根據設備ID與人群標簽的映射關系,將標簽數據應用于實際的廣告活動投放中,埋碼收集廣告活動投放時的曝光、點擊、轉化等數據;根據標簽數據用于廣告活動的反饋數據,分析得出這些標簽數據中設備ID與所攜帶標簽的相關度;
步驟S104:數據評分,根據所述步驟S102和S103中分析得出的標簽準確度和標簽相關度,給這兩個數值賦予權值計算得出該數據源該標簽維度的綜合評分。
步驟S105:數據報告,統計每個數據源已知標簽數據的準確度、相關度、評分,通過界面展示出報告結果。
進一步的,所述步驟S101中采集各數據源的人群標簽數據后,基于設備ID,將來自各數據源的人群標簽數據與可復核大數據樣本進行匹配、驗證。
進一步的,步驟S101和步驟S103中數據采集形式包括離線導入形式和埋碼形式。
更進一步的,通過離線導入的形式,將各數據源的人群標簽數據采集到系統模塊中,數據至少包括設備id、人群標簽這二個字段,且每個設備id攜帶多個人群標簽字段;通過埋碼的形式,將各人群標簽數據用于廣告活動中的投放效果采集到系統模塊中,數據至少包括活動id、設備id、人群標簽、曝光、轉化這六個字段。
本發明還包括一種評估不同數據源數據準確度的裝置,包括依次連接的數據采集模塊、數據驗證模塊、數據應用模塊、數據評分模塊和數據報告模塊;其中,
數據采集模塊,用來采集各數據源的人群標簽數據,統一數據的格式并存儲;
數據驗證模塊,根據來自各數據源的設備ID與人群標簽的映射關系,分析得出各數據源數據與可復核大數據樣本相匹配的準確度;
數據應用模塊:將標簽數據應用于投放,根據廣告活動反饋數據,可以分析得出各數據源數據的相關度;
數據評分模塊,根據數據驗證模塊和數據應用模塊的結果對各數據源的各數據維度進行綜合評分;
數據報告模塊,統計出每個數據源已知數據的準確度、相關度和綜合評分,通過界面展示出報告結果。
采用上述結構和方法后,本發明通過各數據源提供的人群標簽數據,分析、驗證各人群標簽,評估出各數據源數據的匹配度和準確度,基于該驗證結果和廣告活動反饋數據給該維度數據評分,以供投放時參考,以降低企業營銷成本。
附圖說明
下面結合附圖和具體實施方式對本發明作進一步詳細的說明。
圖1為本發明一種評估不同數據源數據準確度的方法的流程圖。
圖2為本發明一種評估不同數據源數據準確度的裝置的結構框圖。
圖中:1為數據采集模塊,2為數據驗證模塊,3為數據應用模塊,4為數據評分模塊,5為數據報告模塊
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津數集科技有限公司,未經天津數集科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611224252.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





