[發(fā)明專利]獨(dú)立訪問者數(shù)量估算方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310030660.X | 申請日: | 2013-01-25 |
| 公開(公告)號: | CN103970752B | 公開(公告)日: | 2017-12-05 |
| 發(fā)明(設(shè)計)人: | 丁若谷;馮是聰;陳家耀;吳明輝 | 申請(專利權(quán))人: | 秒針信息技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司11262 | 代理人: | 栗若木,曲鵬 |
| 地址: | 100102 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 獨(dú)立 訪問者 數(shù)量 估算 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種信息處理技術(shù),尤其涉及一種獨(dú)立訪問者數(shù)量估算方法和系統(tǒng)。
背景技術(shù)
互聯(lián)網(wǎng)環(huán)境下,獨(dú)立訪問者(Unique Visitor,UV)指訪問某網(wǎng)站的用戶群體中獨(dú)立于其他個體而真實(shí)存在的自然人,獨(dú)立訪問者的數(shù)量是一種十分重要的統(tǒng)計指標(biāo)。例如:某篇網(wǎng)絡(luò)新聞的獨(dú)立訪問者數(shù)量反映了其受到關(guān)注的程度;某項(xiàng)調(diào)查的獨(dú)立訪問者數(shù)量關(guān)系到參與調(diào)查的人群基數(shù)大小;某條廣告的獨(dú)立訪問者數(shù)量表示了多少人認(rèn)知了廣告的內(nèi)容;等等。因此,準(zhǔn)確地估算獨(dú)立訪問者數(shù)量在這些場景下將能夠發(fā)揮很大的作用。在上述例子中,媒體的決策者能夠根據(jù)每篇新聞的讀者多少決定未來新聞采編的方向;發(fā)布調(diào)查的機(jī)構(gòu)能夠了解調(diào)查覆蓋的人數(shù)是否足夠使結(jié)果的可靠性達(dá)到特定的置信區(qū)間;廣告主一方面能夠根據(jù)收看一則廣告的獨(dú)立訪問者的數(shù)量來判斷該廣告的到達(dá)率(Reach)是否達(dá)到預(yù)定的指標(biāo),另一方面還能夠避免同一廣告因?yàn)橄蛲挥脩粽故镜念l率(Frequency)過高造成浪費(fèi)。如果獨(dú)立訪問者數(shù)量可以估算得更準(zhǔn)確,那么更多的需要這一統(tǒng)計指標(biāo)的行業(yè)還將受益,而且還可能發(fā)掘出潛在的新行業(yè)。因此,對獨(dú)立訪問者數(shù)量進(jìn)行準(zhǔn)確估算的意義非常重大。
公開于2011年11月24日、公開號為US 2011/0288940 A1的美國專利申請公開了一種基于特征指紋(fingerprint-based)的獨(dú)立訪問者數(shù)量估算方法。該方法基于用戶上網(wǎng)時的瀏覽器類型、操作系統(tǒng)類型、IP(一種互聯(lián)網(wǎng)協(xié)議,可用于識別用戶的大致位置、所屬網(wǎng)絡(luò)等信息)地址等特征把多個不同的cookie(某些網(wǎng)站為了辨別用戶身份而儲存在用戶本地終端上的數(shù)據(jù))對應(yīng)到一個獨(dú)立訪問者。但該技術(shù)方案僅考慮了多個cookie對應(yīng)一個獨(dú)立訪問者的情況,而沒有考慮多個獨(dú)立訪問者對應(yīng)一個cookie的情況。例如,某公司部署了一百臺桌面工作站供員工使用,使用了同一批采購的硬件、系統(tǒng)鏡像安裝的軟件,因而上述特征完全相同,使用這批工作站上網(wǎng)的員工很可能被識別為同一個獨(dú)立訪問者。
另,公開于2012年6月28日、公開號為2012/0166379 A1的美國專利申請公開了一種基于聚類(clustering-based)的獨(dú)立訪問者數(shù)量估算方法。該方法根據(jù)用戶的上網(wǎng)歷史行為,把多個不同的cookie聚類在一起,然后把這個聚類在一起的多個cookie對應(yīng)到同一個獨(dú)立訪問者。這樣就可以根據(jù)聚類的個數(shù)把獨(dú)立訪問者的個數(shù)估算出來。基于聚類的方法最大的優(yōu)點(diǎn)是,可以把多個不同的cookie物理地聚類在一起,這對于那些經(jīng)常清空cookie的用戶識別非常有用。比如,某用戶經(jīng)常在網(wǎng)吧上網(wǎng),由于網(wǎng)吧的電腦裝有還原卡,每次登陸時都會清空cookie,因而該用戶就對應(yīng)多個cookie。然而,這一類方法和基于特征指紋的方法有同樣的問題,即沒有考慮多個獨(dú)立訪問者對應(yīng)一個cookie的情況,導(dǎo)致估算的獨(dú)立訪問者數(shù)量準(zhǔn)確度較低。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是本發(fā)明要解決的技術(shù)問題是提供一種獨(dú)立訪問者數(shù)量估算方法及系統(tǒng),以提高獨(dú)立訪問者數(shù)量估算的準(zhǔn)確性。
為了解決上述技術(shù)問題,本發(fā)明提供了一種獨(dú)立訪問者數(shù)量估算方法,該方法包括:
采集步驟,采集終端的終端標(biāo)識及與各終端標(biāo)識對應(yīng)的身份標(biāo)識;
初始化步驟,初始化每個身份標(biāo)識的變量值為初始值;
終端標(biāo)識變量值計算步驟,根據(jù)各個終端標(biāo)識對應(yīng)的身份標(biāo)識的變量值計算各個終端標(biāo)識的變量值;
估算步驟,提取訪問過指定內(nèi)容的終端標(biāo)識,基于訪問過指定內(nèi)容的終端標(biāo)識的變量值估算訪問該指定內(nèi)容的獨(dú)立訪問者數(shù)量。
為解決上述技術(shù)問題,本發(fā)明還提供了一種獨(dú)立訪問者數(shù)量估算系統(tǒng),該系統(tǒng)包括:
采集裝置,用于采集終端的終端標(biāo)識及與各終端標(biāo)識對應(yīng)的身份標(biāo)識;
初始化裝置,用于初始化每個身份標(biāo)識的變量值為初始值;
終端標(biāo)識變量值計算裝置,用于根據(jù)各個終端標(biāo)識對應(yīng)的身份標(biāo)識的變量值計算各個終端標(biāo)識的變量值;
估算裝置,用于提取訪問過指定內(nèi)容的終端標(biāo)識,基于訪問過指定內(nèi)容的終端標(biāo)識的變量值估算訪問該指定內(nèi)容的獨(dú)立訪問者數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于秒針信息技術(shù)有限公司,未經(jīng)秒針信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310030660.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 迭代信道估算以及基于信道估算的補(bǔ)償
- 接收電平測定系統(tǒng)
- 基于計算機(jī)軟件系統(tǒng)實(shí)現(xiàn)軟件項(xiàng)目成本估算的方法及系統(tǒng)
- 數(shù)據(jù)估算方法、裝置和計算機(jī)可讀存儲介質(zhì)
- 一種項(xiàng)目計劃生成方法、裝置及存儲設(shè)備、程序產(chǎn)品
- 虛擬現(xiàn)實(shí)系統(tǒng)中的用戶身高確定方法及裝置、存儲介質(zhì)
- 一種農(nóng)業(yè)糧食產(chǎn)量估算方法和系統(tǒng)
- 一種電池荷電狀態(tài)SOC估算方法和裝置
- 一種基于多叉樹的公式模型求解編輯器
- 基于時間預(yù)估模型的AGV調(diào)度方法





