[發明專利]一種基于話單的用戶關系確定方法和裝置在審
| 申請號: | 201611257414.8 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN108268477A | 公開(公告)日: | 2018-07-10 |
| 發明(設計)人: | 蔣敏;鄭成林;宋文山 | 申請(專利權)人: | 中國電信股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 方亮 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶關系 方法和裝置 話單數據 用戶交互信息 時段信息 預分類 預處理 用戶間關系 個體用戶 數據基礎 通話記錄 通信領域 信息標識 業務設置 資費標準 資費套餐 單數據 新用戶 運營商 采集 挖掘 分類 對話 | ||
本發明公開了一種基于話單的用戶關系確定方法和裝置,涉及通信領域,其中的方法包括:采集話單數據并對話單數據進行預處理;獲取話單數據的時段信息,基于時段信息對用戶關系進行預分類;獲取話單數據的用戶交互信息,并基于用戶交互信息計算用戶之間的關系親密度值,基于關系親密度值確定被預分類的用戶關系的親密度。本發明的方法和裝置,通過用戶間的通話記錄信息標識用戶關系的分類以及關系親密度,實現針對個體用戶的社會關系的識別,從而可以使運營商在用戶資費套餐的設置、新用戶的挖掘推廣、基本資費標準內容等方面以用戶間關系的作為數據基礎,提高業務設置的準確性和合理性。
技術領域
本發明涉及通信技術領域,尤其涉及一種基于話單的用戶關系確定方法和裝置。
背景技術
電信作為一種通信技術在不斷地改變著人們的生活方式,同時也累積了大量的數據。目前,硬件設備升級已經越來越無法適應現代電信行業競爭的需求,所以眾多電信企業將競爭領域轉移到多年累積的用戶和通話數據上。如何從現有的通話記錄中挖掘出未知的規律和商業信息,已經成為了一個熱門的課題。
對于數據挖掘已經提出了很多新的理論和方法,比如,Kernighan-Lin算法、譜平分法、GN算法、Moustaki算法等。一些算法在實際網絡中也表現出了不錯的挖掘效果。如Moustaki算法基于廣義潛在特質模型提出了隱變量回歸模型問題。利用大規模手機通信數據,從移動社會網絡拓撲結構的角度分析用戶間的關系強度,使用計算模型通過收集用戶一定時間周期內的手機通話記錄來計算和分析用戶間的關系強度。分析了兩百萬用戶的手機通信數據,提出衡量關系穩定性的方法,并揭示了用戶關系穩定性隨時間的動態變化規律。但是,目前的方法通常只給出目標用戶對的總體關系強度,不能明確用戶的不同關系親密性,無法滿足實際應用的需求。
發明內容
有鑒于此,本發明要解決的一個技術問題是提供一種基于話單的用戶關系確定方法和裝置。
根據本發明的一個實施例,提供一種基于話單的用戶關系確定方法,包括:采集話單數據并對所述話單數據進行預處理;獲取所述話單數據的時段信息,基于所述時段信息對用戶關系進行預分類;獲取所述話單數據的用戶交互信息,并基于所述用戶交互信息計算用戶之間的關系親密度值,基于關系親密度值確定被預分類的用戶關系的親密度;基于預設的檢驗規則判斷對于所述用戶關系的預分類結果是否正確,如果否,則將所述用戶關系標識為不能識別的用戶關系。
可選地,所述對所述話單數據進行格式化處理包括:基于統計規則對第一用戶與其它用戶之間的第一話單進行統計,其中,所述統計規則包括按照主動性標識、交互頻繁性標識、時段交互性標識和交互時長性標識進行統計。
可選地,獲取對于單向的第一話單按照所述交互頻次標識、所述交互方向性標識進行統計的統計結果;基于所述統計結果判斷第一用戶與所述單向的第一話單的主叫或被叫用戶之間的關系是否為咨詢關系或營銷關系;如果是,則標識所述單向的第一話單為非統計數據,并從所述第一話單中刪除。
可選地,所述獲取所述話單數據的時段信息、基于所述時段信息對用戶關系進行預分類包括:預設工作時段和休息時段的時段信息;獲取對于第一話單按照所述時段標識分揀進行統計的統計結果;基于所述統計結果以及所述時段信息對第一用戶與第二用戶之間的關系進行預分類并標識;所述第二用戶為所述第一話單的主叫或被叫用戶;其中,基于工作時段進行預分類的用戶關系包括:同事、業務、其它關系;基于休息時段進行預分類的用戶關系包括:親人、朋友、其它關系。
可選地,所述獲取所述話單數據的用戶交互信息、并基于所述用戶交互信息計算用戶之間的關系親密度值包括:對于第一話單按照所述時段標識進行分揀、統計,將所述第一話單分為工作時段第一話單、休息時段第一話單;基于按照主動性標識、交互頻繁性標識、交互時長性標識對所述工作時段第一話單、所述休息時段第一話單的統計結果分別確定所述第一用戶與所述第二用戶在工作時段、休息時段的交互強度和親密度評估值;分別確定所述第一用戶與所述第二用戶在工作時段、休息時段的關系親密度=交互強度/親密度評估值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電信股份有限公司,未經中國電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611257414.8/2.html,轉載請聲明來源鉆瓜專利網。





