[發(fā)明專利]基于流量分析識(shí)別用戶行為對(duì)象的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201510713401.6 | 申請(qǐng)日: | 2015-10-28 |
| 公開(kāi)(公告)號(hào): | CN106650760A | 公開(kāi)(公告)日: | 2017-05-10 |
| 發(fā)明(設(shè)計(jì))人: | 黨倩 | 申請(qǐng)(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F17/30 |
| 代理公司: | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司11205 | 代理人: | 楊貝貝,黃健 |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 流量 分析 識(shí)別 用戶 行為 對(duì)象 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及流量識(shí)別技術(shù),尤其涉及一種基于流量分析識(shí)別用戶行為對(duì)象的方法和裝置。
背景技術(shù)
近年來(lái),數(shù)據(jù)業(yè)務(wù)呈現(xiàn)爆炸式的增長(zhǎng),對(duì)用戶的數(shù)據(jù)流進(jìn)行識(shí)別則是運(yùn)營(yíng)商進(jìn)行網(wǎng)絡(luò)管理和服務(wù)優(yōu)化的重要研究?jī)?nèi)容。
目前,數(shù)據(jù)流識(shí)別主要是采用機(jī)器學(xué)習(xí)的方法來(lái)實(shí)現(xiàn),具體為:根據(jù)數(shù)據(jù)流中包含的用戶上網(wǎng)日志和用戶網(wǎng)絡(luò)通信數(shù)據(jù)包等,分析數(shù)據(jù)流的持續(xù)時(shí)長(zhǎng)、端口號(hào)、包長(zhǎng)和時(shí)間間隔等統(tǒng)計(jì)特征,并根據(jù)統(tǒng)計(jì)特征對(duì)數(shù)據(jù)流進(jìn)行分類識(shí)別,從而研究用戶的興趣偏好,例如,針對(duì)端口號(hào)的分布,采用信息熵特征和數(shù)據(jù)挖掘技術(shù)對(duì)多種數(shù)據(jù)流進(jìn)行分類識(shí)別;或者,通過(guò)考察數(shù)據(jù)流的持續(xù)時(shí)長(zhǎng)和時(shí)間間隔的相關(guān)系數(shù)對(duì)語(yǔ)音流量進(jìn)行分類識(shí)別等。
但是,對(duì)于經(jīng)過(guò)端口地址轉(zhuǎn)換、隱私保護(hù)等技術(shù)處理過(guò)的數(shù)據(jù)流,運(yùn)營(yíng)商無(wú)法通過(guò)分析用戶網(wǎng)絡(luò)通信數(shù)據(jù)包來(lái)獲取數(shù)據(jù)流的統(tǒng)計(jì)特征,即運(yùn)營(yíng)商無(wú)法通過(guò)數(shù)據(jù)流識(shí)別來(lái)研究用戶的興趣偏好,導(dǎo)致運(yùn)營(yíng)商不能根據(jù)用戶的興趣偏好為用戶提供數(shù)據(jù)業(yè)務(wù),嚴(yán)重影響了數(shù)據(jù)業(yè)務(wù)的服務(wù)質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種基于流量分析識(shí)別用戶行為對(duì)象的方法和裝置,使得運(yùn)營(yíng)商可以根據(jù)行為對(duì)象研究用戶的興趣偏好,從而根據(jù)用戶的興趣偏好為用戶提供數(shù)據(jù)業(yè)務(wù),提高數(shù)據(jù)業(yè)務(wù)的服務(wù)質(zhì)量。
第一方面,本發(fā)明實(shí)施例提供一種基于流量分析識(shí)別用戶行為對(duì)象的方法,包括:獲取用戶數(shù)據(jù)流中的上網(wǎng)日志;根據(jù)預(yù)設(shè)的用戶知識(shí)庫(kù),識(shí)別所述上網(wǎng)日志對(duì)應(yīng)的上網(wǎng)行為,并對(duì)所述上網(wǎng)日志進(jìn)行語(yǔ)義化標(biāo)注,得到標(biāo)注后的上網(wǎng)日志;其中,所述標(biāo)注后的上網(wǎng)日志包括用戶標(biāo)識(shí)、上網(wǎng)時(shí)間、行 為名稱和行為對(duì)象;根據(jù)所述標(biāo)注后的上網(wǎng)日志中的上網(wǎng)時(shí)間和行為名稱,確定所述標(biāo)注后的上網(wǎng)日志中的第一日志和第二日志為關(guān)聯(lián)事件;其中,所述第二日志對(duì)應(yīng)的行為對(duì)象為空;根據(jù)所述關(guān)聯(lián)事件生成中間事件,所述中間事件包括所述用戶標(biāo)識(shí)、所述第二日志對(duì)應(yīng)的上網(wǎng)時(shí)間和所述第一日志對(duì)應(yīng)的行為對(duì)象。其中,用戶數(shù)據(jù)流為運(yùn)營(yíng)商服務(wù)器獲取到的用戶的移動(dòng)終端的數(shù)據(jù)流,用戶知識(shí)庫(kù)中包括URL的解析規(guī)則、關(guān)鍵字符串與行為ID之間的對(duì)應(yīng)關(guān)系、行為ID與行為名稱之間的對(duì)應(yīng)關(guān)系、關(guān)鍵字符串與行為對(duì)象之間的對(duì)應(yīng)關(guān)系等,上網(wǎng)日志對(duì)應(yīng)的上網(wǎng)行為至少包括行為名稱和行為對(duì)象,語(yǔ)義化標(biāo)注指的是為上網(wǎng)日志的上網(wǎng)行為打標(biāo)簽,關(guān)聯(lián)事件為行為之間具有必然聯(lián)系、且連續(xù)發(fā)生的多個(gè)事件,行為對(duì)象為空指的是根據(jù)用戶知識(shí)庫(kù)無(wú)法獲取到該上網(wǎng)日志對(duì)應(yīng)的行為對(duì)象,中間事件用于研究用戶的偏好信息。本實(shí)施例提供的基于流量分析識(shí)別用戶行為對(duì)象的方法,根據(jù)用戶數(shù)據(jù)流中的上網(wǎng)日志識(shí)別用戶的行為和行為對(duì)象,便于運(yùn)營(yíng)商根據(jù)行為對(duì)象研究用戶的興趣偏好,從而根據(jù)用戶的興趣偏好為用戶提供數(shù)據(jù)業(yè)務(wù),提高數(shù)據(jù)業(yè)務(wù)的服務(wù)質(zhì)量。
結(jié)合第一方面,在第一方面的第一種可能實(shí)現(xiàn)方式中,所述根據(jù)所述標(biāo)注后的上網(wǎng)日志中的上網(wǎng)時(shí)間和行為名稱,確定所述標(biāo)注后的上網(wǎng)日志中的第一日志和第二日志為關(guān)聯(lián)事件,具體為:根據(jù)所述第二日志對(duì)應(yīng)的行為名稱,確定所述第二日志為關(guān)鍵事件;根據(jù)所述第一日志對(duì)應(yīng)的上網(wǎng)時(shí)間和所述第二日志對(duì)應(yīng)的上網(wǎng)時(shí)間,確定所述第一日志和所述第二日志為連續(xù)產(chǎn)生的上網(wǎng)日志。在本實(shí)施例中,關(guān)鍵事件為用于決定用戶偏好的事件,運(yùn)營(yíng)商服務(wù)器確定關(guān)鍵事件后,再確定第一日志和第二日志為連續(xù)產(chǎn)生的上網(wǎng)日志,從而找出關(guān)聯(lián)事件,由于關(guān)聯(lián)事件中的行為對(duì)象為空,根據(jù)第一日志和第二日志之間的關(guān)聯(lián)關(guān)系可以推測(cè)出關(guān)鍵事件中的行為對(duì)象,從而可以根據(jù)關(guān)鍵事件的行為對(duì)象研究用戶偏好,為用戶提供感興趣的數(shù)據(jù)業(yè)務(wù),方便用戶及時(shí)獲取所需的信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510713401.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





