[發明專利]一種用戶話單大數據基站連接信息用戶關系推定方法在審
| 申請號: | 201710982406.8 | 申請日: | 2017-10-20 |
| 公開(公告)號: | CN107729940A | 公開(公告)日: | 2018-02-23 |
| 發明(設計)人: | 曹萬鵬;史輝;羅云彬;李鵬;李浩;徐青;林紹福 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京思海天達知識產權代理有限公司11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 話單大 數據 基站 連接 信息 關系 推定 方法 | ||
技術領域
本發明屬于人工智能技術領域,尤其涉及一種基于 Bayes的用戶話單大數據基站連接信息用戶關系推定方法。
背景技術
分類算法就是基于分類器模型為待檢測樣本從可選的分類中選取最佳的類別假設,它屬于人工智能中機器學習范疇,已經吸引了該領域相關研究者的極大關注。人們投入了大量的時間和精力研究諸如C4.5、支持向量機、貝葉斯算法、AdaBoost算法和K-最近鄰分類算法等分類算法,并將它們應用于面部識別、筆跡驗證、數據分析和醫學應用等不同領域。
而貝葉斯算法中,樸素貝葉斯分類器(Naive Bayes Classifiers)由于其高精度、高效率、理論基礎堅實等優點而得到了廣泛應用。樸素貝葉斯分類器是基于給定分類特征條件下屬性值之間相互條件獨立的假設而工作的。盡管現實中這種獨立性假設常常難以滿足,但近期對監督性學習的研究表明在很多領域,基于這一假設的樸素貝葉斯分類器在分類性能上可以與決策樹算法、最近鄰算法等一批優秀分類算法相媲美。
樸素貝葉斯分類器有以下特征,它并不確定的指定樣本屬于哪一類,而是通過概率的計算給出樣本屬于某一類別的可能。當樣本屬于某一類的概率最高時,判斷這一分類假設為該樣本的類別。假設A1,A2,…,An是一個n個特征的數據集,且有m個分類類別,C={C1,C2,C3,…,Cm}。給定一個具體的樣本x,其對應特征屬性為a1,a2,...,an,這里ai是特征屬性Ai的具體取值,該樣本屬于某一類別Ci的后驗概率是P(x|Ci),c(x)表示分類所得的樣本分類標簽。貝葉斯分類器模型可表示為:
c(x)=arg max P(Ci)P(X|Ci)(I)
但是上述公式的后驗概率常難以計算,因此樸素貝葉斯分類器引入了以下假設:在給定類別C的條件下,所有的屬性Ai相互獨立。即:
在樸素貝葉斯分類算法中,既可以獨立的學習每個特征屬性Ai在類別C下的條件概率P(Ai|C),也可以獨立學習每個屬性Ai的概率。因為P(C)值為常數,可用歸一化因子a來代替。然后,分類器應用貝葉斯公式計算特定樣本數據在給定屬性值下類別的后驗概率為:
決定樸素貝葉斯分類算法性能的一個重要因素是樣本特征的選擇,好的樣本特征選擇可以提高分類器的分類性能,而一個不恰當的特征選取必然導致誤判率的增高。本發明基于用戶之間通信相關特征、基站連接相關特征與用戶親疏度之間的關系,提出基于用戶話單大數據中基站連接信息的用戶關系推定方法與系統。
發明內容
基于用戶之間通話相關特征、基站連接相關特征與用戶親疏度之間的關系,提供一種基于 Bayes的用戶話單大數據基站連接信息用戶關系推定方法,通過對一般用戶生活特征的分析,基于統計方法進行這幾個特征的計算:1、計算用戶間互通話信息(頻次、時長、粘度等);2、計算用戶間相同基站連接信息(頻次、粘度、時間點等)。根據上述信息,基于 Bayes分類算法,采用用戶話單大數據相關統計量,對用戶的可能親疏程度進行準確判斷,使得最終基于 Bayes算法的分類器分類效果更佳、分類精度更高。
一種用戶話單大數據基站連接信息用戶關系推定方法,包括如下步驟:
(1)基于話單大數據信息,發掘能從根本上反映不同用戶之間關系親疏程度的相關特征數據;
在話單大數據中定位某用戶及其連接的全部基站信息,尋找這些基站下與該用戶同時出現的其他用戶,包括用戶間通話的相關信息(全部),共同出現在相同基站下的頻次信息,出現在相同基站下的頻次信息,一定時間內共同出現在相同基站下的粘度信息,出現在相同基站下的時間點信息(早、中、晚;工作日、休息日;節假日等),上述信息的離散度信息等相關數據;
(2)對所要分析用戶間上述話單數據中基站數據進行分析,對上述相關特征信息進行提取、分析和處
本發明涉及到對話單中可以推斷用戶之間親疏程度信息的挖掘、計算、分析,它們決定了是否可以準確、高效的對用戶的親疏度進行推斷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710982406.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





