[發明專利]確定寬帶網絡接入點信息的方法和裝置有效
| 申請號: | 201710635652.6 | 申請日: | 2017-07-31 |
| 公開(公告)號: | CN110020234B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 李明洋;孫靜博;楊明川;劉楊;劉康;曹詩苑;全碩;左闖;盧毅;杜帥;賀群 | 申請(專利權)人: | 中國電信股份有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/35 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 趙倩男 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 寬帶 網絡 接入 信息 方法 裝置 | ||
本發明公開了一種確定寬帶網絡接入點信息的方法和裝置,涉及網絡數據分類領域。其中的方法包括:抽取寬帶網絡數據中的用戶信息;根據用戶信息提取用戶特征;將用戶特征作為分類器的輸入量,利用分類器初步預測用戶對應的寬帶網絡接入點信息;其中,利用已標注的寬帶網絡接入點信息訓練分類器,構建機器學習模型。本發明提高了寬帶網絡接入點信息確認的效率,為填補缺失信息以及對信息糾錯提供了數據。
技術領域
本發明涉及網絡數據分類領域,尤其涉及一種確定寬帶網絡接入點信息的方法和裝置。
背景技術
通常用戶在辦理寬帶上網業務時,會記錄一些基本信息,如聯系人、寬帶類型(家庭、企業等)等。其中,寬帶網絡的實際用途,對于網絡流量數據分析起著重要作用,其原因在于:
第一,了解真實地寬帶實際用途,對于開展業務推薦有很大幫助,比如,能夠對家庭單位進行買車預測等精準營銷,為小型企業與大型企業提供不同流量套餐等。第二,能夠防止本是企業寬帶的用戶刻意隱瞞真實用途,逃避信息的審查或減少必須的開銷。第三,但寬帶網絡不像移動網絡環境下能標識用戶個體,導致網絡下用戶不唯一,使得圍繞用戶進行的各項分析則無法順利進行,如果能準確區分出家庭接入點,對于家庭下的個人行為分析將更容易追蹤。
由此可見,準確的寬帶網絡接入點信息有助于數據分析的展開與運營商業務的發展。然而,由于用戶填寫隨意性、刻意隱瞞真實用途等原因,寬帶網絡接入點在運營商系統中的實際記錄存在以下問題:
第一,在收集信息時,難免會出現用戶漏填等情況,導致數據的缺失,使得原有家庭/企業分類標簽不完整。據統計,某市電信固網有分類標簽的接入點僅占總數的29%左右,大量的信息需要追溯。第二,實際填寫時可能存在用戶隱瞞真實用途,或寬帶用途有變化等情況,導致部分數據記錄不實,例如接入點類型與實際用途不一致或不準確。第三,曾經的家庭住所被用來作為初創公司的工作環境、小型娛樂場所等,使得寬帶網絡接入點的真實用途有變化,然而運營商卻無法獲知情況。
發明內容
本發明要解決的一個技術問題是一種確定寬帶網絡接入點信息的方法和裝置能夠提高寬帶網絡接入點信息確認的效率。
根據本發明一方面,提出一種確定寬帶網絡接入點信息的方法,包括:抽取寬帶網絡數據中的用戶信息;根據用戶信息提取用戶特征;將用戶特征作為分類器的輸入量,利用分類器初步預測用戶對應的寬帶網絡接入點信息;其中,利用已標注的寬帶網絡接入點信息訓練分類器,構建機器學習模型。
進一步地,該方法還包括:根據強假設條件重新標注已標注的寬帶網絡接入點信息,并賦予訓練權重;利用重新標注的寬帶網絡接入點信息訓練分類器,并將用戶特征作為分類器的輸入量,利用二元分類模型初步預測用戶對應的寬帶網絡接入點信息。
進一步地,根據強假設條件重新標注已標注的寬帶網絡接入點信息,并賦予訓練權重包括:若寬帶網絡接入點的設備數量大于等于第一閾值,則標注寬帶網絡接入點類型為企業,并賦予第一訓練權重;若寬帶接入點的設備數量小于等于第二閾值,則標注寬帶網絡接入點類型為家庭,并賦予第二訓練權重;若寬帶接入點的設備數量大于第二閾值且小于第一閾值,則保持寬帶網絡接入點的已標注類型,并賦予第三訓練權重;其中,第一訓練權重和第二訓練權重大于第三訓練權重。
進一步地,該方法還包括:基于時間推移的投票機制,以預定時間為單位訓練分類器,采用相對多數投票法更新用戶對應的寬帶網絡接入點信息的預測結果。
進一步地,用戶信息包括用戶賬號信息和用戶行為信息;抽取寬帶網絡數據中的用戶信息包括:通過用戶賬號的正則表達式,從寬帶網絡數據的統一資源定位符URL中匹配出用戶賬號信息;基于一級域名從寬帶網絡數據的URL中獲取用戶行為信息。
進一步地,用戶特征包括用戶賬號特征和用戶行為特征;基于用戶賬號數量、用戶行為豐富度和/或接入點活躍時間段確定用戶賬號特征和用戶行為特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電信股份有限公司,未經中國電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710635652.6/2.html,轉載請聲明來源鉆瓜專利網。





