[發明專利]一種基于鼠標行為的用戶分類方法有效
| 申請號: | 201310395555.6 | 申請日: | 2013-09-03 |
| 公開(公告)號: | CN103440328A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 鄧玉輝;鄧偉鴻 | 申請(專利權)人: | 暨南大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/0484;G06F3/033 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 陳燕嫻 |
| 地址: | 510632 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 鼠標 行為 用戶 分類 方法 | ||
技術領域
本發明涉及數據分析的技術領域,特別涉及一種基于鼠標行為的用戶分類方法。
背景技術
隨著互聯網技術的發展,互聯網上的內容也隨著越來越豐富,我們能獲得越來越多的信息,網絡已經成為現代人生活中不可或缺的一部分。但是,對于個人來說,我們每天能夠用于上網的時間是有限的。所以,對于互聯網服務的提供者,特別是移動互聯網,如何吸引用戶的注意力,為用戶提供更好的服務,成為了互聯網服務提供者的一個值得深入研究的課題。時下,用于研究用戶行為信息主要有以下兩種方式:
一、基于網絡日志的用戶喜好挖掘。
作者在題目確定之初就已經在中國知網等大型的論文數據庫里面進行了長時間的文獻搜索。結果發現,基本上所有針對于網絡上的用戶喜好的數據挖掘都是基于網絡日志,即只記錄了用戶的訪問日志,然后基于日志URL的數據進行內容級別的挖掘。
這種方法可以直接挖掘到用戶在最近一段時間內關注的內容,進而能夠比較精確的確定用戶的喜好。但是每個網頁的信息并不局限于短短的URL,所以這種方法并不能具體而準確地得知用戶關注的是網頁中的哪些內容。
二,服務端對于用戶的一些基本的點擊信息的統計
現在很多人也利用挖掘到的一些IP(獨立IP數)、PV(訪問量)、UV(獨立訪客)乃至于用戶訪問的深度、在網頁停留的時間等數據進行用戶行為的挖掘。即通過用戶登陸一個網站后所做的一切有目的事情都記錄下來,進而挖掘其本身內在的意義。
這種方法主要是用于服務端的統計,可以知道對于網站本身哪些方面比較吸引訪問的用戶,結合前一種基于網絡日志的挖掘方法,可以很好地實現C/S模式上的挖掘互補。
但是,這些挖掘到的數據都是用戶已經瀏覽的信息,對于用戶是否對已經瀏覽過的信息來確定其依然對這方面的信息感興趣本來就值得懷疑的。而且,這些方式并沒有很好地研究用戶在進入網站后的動作特征,并沒有很好第體現用戶的操作習慣。
利用鼠標操作計算機是人類與計算機進行溝通的一個重要行為。因此,對用戶使用鼠標的行為進行研究,能為我們提供針對不同人群的習慣以及喜好提供更多的有效依據,并且可以更加迅速、實時、精準地定位正在瀏覽網頁的用戶特征。
另外,網絡的虛擬世界已經成為了人類人與人之間溝通、獲取信息的最重要途徑之一。時下充斥著“宅男”、“宅女”等流行詞語無不暗示著人們使用PC甚至手機接入互聯網的已經成為了除了生活中最主要的一部分了。而且,在圖形界面下,人類與計算機最直接迅速的溝通行為就是鼠標行為,使用鼠標就如同我們直接地使用雙手去做事那樣子。所以,研究用戶的鼠標行為能夠為網站提供更多有用的用戶信息。
發明內容
本發明的目的在于克服現有技術的缺點與不足,提供一種在客戶端收集數據并對用戶進行分類的方法。
本發明的目的通過下述技術方案實現:
一種基于鼠標行為的用戶分類方法,包括下述步驟:
S1、對電腦屏幕區域劃分,對用戶不同尺寸的屏幕、分辨率進行統一量化;
S2、建立鼠標熱點區域模型,統計在規定時間間隔的鼠標坐標序列內,其落在每個已經劃分好的區域的次數,然后根據鼠標在某個區域內出現的次數的多寡,來判斷該區域的熱點程度,同時通過比較不同類別用戶每個區域熱點程度的不同來進行分類;
S3、建立鼠標活躍度模型,用于評定每個劃分好的區域內用戶鼠標移動的活躍程度,鼠標的活躍程度是在一個時間段內這個區域內鼠標坐標分布的離散程度,離散程度越高,則說明這個區域的用戶的鼠標動作越活躍,根據用戶每個區域鼠標活躍度的異同特征,對用戶進行分類。
優選的,通過使用Windows提供的API、Linux的shell腳本或者瀏覽器的Javascript腳本來讀取用戶屏幕的分辨率,并根據實際應用情況來進行區域的劃分。
優選的,對于鼠標熱點區域模型,在其實際投入運行之前,需要收集并利用用戶的數據來對不同類別的人群進行數據分析,挖掘其在電腦屏幕或者網頁內熱點區域的異同,統計得出基于最大似然概率的分類先驗概率;熱點區域的判斷方法為:分類別導入某一類別的用戶的一定量基于時間序列的鼠標坐標數據,判斷每個鼠標坐標所在區域,然后在其所在區域的熱點頻度上加一,當數據導入完之后,頻率高的區域即為其熱點區域,通過控制導入不同類別用戶的數據集數據量,使得它們大小相等,從而進行不同區域的頻率統計,把其頻率歸一化作為其分類的先驗性概率。
優選的,把頻率歸一化作為鼠標行為用戶分類的先驗性概率的具體方法如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暨南大學,未經暨南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310395555.6/2.html,轉載請聲明來源鉆瓜專利網。





