[發(fā)明專利]一種基于用戶信息的數(shù)據(jù)分析方法有效
| 申請?zhí)枺?/td> | 202010769479.0 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111654853B | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設(shè)計)人: | 邵俊;藺靜茹;張磊;曹新建;支磊 | 申請(專利權(quán))人: | 索信達(北京)數(shù)據(jù)技術(shù)有限公司;深圳索信達數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | H04W8/18 | 分類號: | H04W8/18;H04W72/12;G06K9/62 |
| 代理公司: | 北京市隆安律師事務(wù)所 11323 | 代理人: | 楊云 |
| 地址: | 100020 北京市朝陽區(qū)望京東園*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶信息 數(shù)據(jù) 分析 方法 | ||
本發(fā)明涉及一種基于用戶信息的數(shù)據(jù)分析方法及系統(tǒng)。所述方法包括以下步驟:接收用戶信息;將所述用戶信息轉(zhuǎn)換匯總為用戶大數(shù)據(jù)集合;將所述用戶大數(shù)據(jù)集合隨機劃分為兩個集合,所述兩個集合包括第一集合和第二集合;對所述第一集合進行分箱相關(guān)處理,得到第三集合;基于所述第三集合采用因子分析法構(gòu)建第一模型;基于所述第二集合對所述第一模型進行驗證。與現(xiàn)有技術(shù)相比,本發(fā)明通過使用因子分析法在盡可能保留精度的情況下消除共線性,避免了為了消除共線性而簡單地保留某個在簇類最有代表性的變量(例如與主成分相關(guān)性最大)而丟失了重要變量和精度,從而提高了數(shù)據(jù)分析的準確性。
技術(shù)領(lǐng)域
本發(fā)明屬于大數(shù)據(jù)分析與數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種基于用戶信息的數(shù)據(jù)分析方法及系統(tǒng)。
背景技術(shù)
隨著移動通信技術(shù)的發(fā)展,移動通信業(yè)務(wù)種類越來越多,對通訊資源的需求也迅速增長,然而當前可用的無線通訊資源有限,在多用戶多業(yè)務(wù)的條件下如何合理調(diào)配資源,提高無線資源的利用效率,是目前移動通信領(lǐng)域研究的熱點和難點,而在無線資源調(diào)度過程中的一個關(guān)鍵問題就是確定用戶優(yōu)先級。
用戶優(yōu)先級別的確定是一個多目標求解的問題,需要同時綜合考慮用戶使用資源的公平性、無線資源使用效率、系統(tǒng)吞吐量、服務(wù)質(zhì)量等多個目標的約束。目前對用戶優(yōu)先級的判別方法,或只考慮技術(shù)上的需求,或只考慮業(yè)務(wù)上的需求,沒有全面考慮用戶自身的影響因素,導致用戶在資源的使用分配上的確定具有片面性。回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照自變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且自變量之間存在線性相關(guān),則稱為多重線性回歸分析。
在中國專利ZL201510881058.6中提出了一種消除復雜系統(tǒng)中回歸數(shù)據(jù)共線性問題的優(yōu)化分析方法,其實質(zhì)是一種基于主成分分析不斷篩選變量的方法。該方法的主要步驟是在每次計算出主成分后挑選出與其相關(guān)性最大的變量,同時剔除出其他與其高度相關(guān)的變量,并計算下一個主成分。雖然其對變量進行了選擇,但是上述方法還可能存在兩個弊端:挑選出的變量對模型的貢獻度可能并不高;在剔除變量的過程中對于高度相關(guān)的判斷存在很強的主觀性,容易丟失重要變量。由于挑選的變量不典型,同時又丟失了重要變量,最終會造成系統(tǒng)的數(shù)據(jù)分析不精確,導致系統(tǒng)的可信度變低。因此,對于獲得的海量數(shù)據(jù)信息,如何進行快速高效地分類整理建模,提取滿足預設(shè)條件的有價值的或者所關(guān)心的數(shù)據(jù)信息,是大數(shù)據(jù)分析與數(shù)據(jù)挖掘領(lǐng)域面臨的技術(shù)問題。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的在于提供一種能夠有效提高基于用戶信息的挖掘精度的方法及系統(tǒng)。
為了達到上述目的,本發(fā)明提供一種基于用戶信息的數(shù)據(jù)分析方法,包括以下步驟:
接收用戶信息;
將所述用戶信息轉(zhuǎn)換匯總為用戶大數(shù)據(jù)集合;
將所述用戶大數(shù)據(jù)集合隨機劃分為兩個集合,所述兩個集合包括第一集合和第二集合,所述第一集合存儲到第一數(shù)據(jù)庫中,所述第二集合存儲到第二數(shù)據(jù)庫中;
對所述第一數(shù)據(jù)庫中的所述第一集合進行分箱相關(guān)處理,得到第三集合,將所述第三集合存儲到第三數(shù)據(jù)庫中;
提取所述第三數(shù)據(jù)庫中的第三集合,并基于所述第三集合采用因子分析法構(gòu)建第一模型;
提取所述第二數(shù)據(jù)庫中的第二集合,基于所述第二集合對所述第一模型進行驗證;
其中,所述基于所述第三集合采用因子分析法構(gòu)建所述第一模型,具體包括:
使用因子分析法進行變量聚類;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索信達(北京)數(shù)據(jù)技術(shù)有限公司;深圳索信達數(shù)據(jù)技術(shù)有限公司,未經(jīng)索信達(北京)數(shù)據(jù)技術(shù)有限公司;深圳索信達數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010769479.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡(luò)
H04W8-00 網(wǎng)絡(luò)數(shù)據(jù)管理
H04W8-02 .移動性數(shù)據(jù)處理,例如,在HLR[歸屬位置寄存器]或VLR[訪問位置寄存器]上的注冊信息;在例如HLR,VLR或外部網(wǎng)絡(luò)之間的移動性數(shù)據(jù)傳送
H04W8-18 .用戶或訂戶數(shù)據(jù)的處理,例如,訂閱的業(yè)務(wù),用戶優(yōu)先權(quán)或用戶簡檔;用戶或訂戶數(shù)據(jù)的傳送
H04W8-22 .終端數(shù)據(jù)的處理或傳送,例如狀態(tài)或物理能力
H04W8-26 .用于移動性支持的網(wǎng)絡(luò)尋址或編號
H04W8-30 .網(wǎng)絡(luò)數(shù)據(jù)恢復
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





