[發(fā)明專利]一種基于大數(shù)據(jù)平臺的信息展示方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110498623.6 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113190670A | 公開(公告)日: | 2021-07-30 |
| 發(fā)明(設計)人: | 韋鵬程;顏蓓;賀方成;陳美成 | 申請(專利權)人: | 重慶第二師范學院 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F16/35;G06F40/194;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京國坤專利代理事務所(普通合伙) 11491 | 代理人: | 張國棟 |
| 地址: | 400064*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數(shù)據(jù) 平臺 信息 展示 方法 系統(tǒng) | ||
1.一種基于大數(shù)據(jù)平臺的信息展示系統(tǒng),其特征在于,所述基于大數(shù)據(jù)平臺的信息展示系統(tǒng)包括:
輸入模塊,與中央控制模塊連接,用于利用輸入設備或輸入裝置確定待展示的內容關鍵詞;
數(shù)據(jù)挖掘模塊,與中央控制模塊連接,用于基于輸入的關鍵詞利用大數(shù)據(jù)挖掘技術獲取與所述關鍵詞相關的所有數(shù)據(jù),包括:
(1)從各個服務器中獲取多個維度的大數(shù)據(jù),并利用AP聚類對所述維度的所有大數(shù)據(jù)進行進行初步歸類,得到每個維度的稀疏向量;其中,所述AP聚類的實現(xiàn)方法,包括:
計算矩陣E的相似性矩陣,相似性度量采用皮爾遜相關系數(shù),兩個樣本點i和k,兩個樣本點通過傳遞信息響應性和適用性判斷作為聚類中心的樣本點:
其中,s(i,k)代表i和k兩個樣本點的相似性,r(i,k)是由樣本點i發(fā)給候選聚類中心k的,用來表明與其他候選聚類中心k’相比,樣本點k適合作為樣本點i的聚類中心所積累的證據(jù);a(i,k)是由候選聚類中心k傳遞給樣本點i的,用來表明考慮到其他樣本點i’對樣本點k成為聚類中心的支持度上,樣本點i挑選樣本點k作為聚類中心的累積合適程度,a(i,k)初始值為0;根據(jù)最大化每個樣本點兩個變量之和來判斷當前樣本點是聚類中心,還是隸屬于其他的聚類中心;
(2)利用AP聚類的結果對稀疏向量進行分類,提取每個維度的稀疏向量的特征信息,并根據(jù)每個維度的稀疏向量的特征信息,確定與所述輸入關鍵詞相關的多個數(shù)據(jù)挖掘項目以及每個數(shù)據(jù)挖掘項目對應的待挖掘數(shù)據(jù)維度;
(3)將分類后的向量作為ISA雙向聚類的輸入,根據(jù)所述多個數(shù)據(jù)挖掘項目以及每個數(shù)據(jù)挖掘項目對應的待挖掘數(shù)據(jù)維度,分別在每個數(shù)據(jù)挖掘項目下獲取待挖掘數(shù)據(jù)維度對應的關鍵詞相關數(shù)據(jù);
(4)根據(jù)在每個數(shù)據(jù)挖掘項目下獲取待挖掘數(shù)據(jù)維度對應的關鍵詞相關數(shù)據(jù),得到數(shù)據(jù)挖掘結果;
數(shù)據(jù)預處理模塊,與中央控制模塊連接,用于對挖掘得到的所有數(shù)據(jù)進行清洗、去重以及歸一化處理;其中,所述對挖掘得到的所有數(shù)據(jù)進行清洗,包括:
(1)根據(jù)挖掘得到的數(shù)據(jù)信息創(chuàng)建用于清洗相應挖掘數(shù)據(jù)的清洗映射區(qū);
(2)根據(jù)數(shù)據(jù)挖掘關鍵詞息,配置對應的清洗節(jié)點序列和網(wǎng)格清洗劃分策略,并將所述清洗節(jié)點序列和網(wǎng)格清洗劃分策略關聯(lián)到相應的清洗映射區(qū);
(3)根據(jù)所述清洗節(jié)點序列和網(wǎng)格清洗劃分策略對創(chuàng)建的所述清洗映射區(qū)進行數(shù)據(jù)清洗;
所述歸一化處理,包括:
接收用戶輸入的實體歸一化策略相關的規(guī)則參數(shù);所述規(guī)則參數(shù)包括至少一個待比較的目標屬性、所述目標屬性對應的比較條件參數(shù)、以及各目標屬性對應的比較條件之間組合的比較規(guī)則;
根據(jù)所述規(guī)則參數(shù)以及預設的代碼生成規(guī)則,生成實體歸一化策略對應的程序代碼;
所述根據(jù)所述規(guī)則參數(shù)以及預設的代碼生成規(guī)則,生成實體歸一化策略對應的程序代碼,包括:針對任意一個待比較的目標屬性,根據(jù)所述目標屬性的類型、以及所述目標屬性對應的比較條件參數(shù),獲取所述目標屬性的比較函數(shù);根據(jù)每一比較規(guī)則,調用對應的比較函數(shù)、并確定邏輯運算類型,得到所述比較規(guī)則的程序代碼;根據(jù)各比較規(guī)則的程序代碼得到所述實體歸一化策略對應的程序代碼;
運行所述實體歸一化策略對應的程序代碼,對預設的實體數(shù)據(jù)集合中的實體進行歸一判定,以將相同實體進行聚類;
中央控制模塊,與輸入模塊、數(shù)據(jù)挖掘模塊、數(shù)據(jù)預處理模塊、聚類模塊、語義特征提取模塊、驗證模塊、數(shù)據(jù)篩選模塊、數(shù)據(jù)融合模塊、分析模塊、展示參數(shù)設置模塊、數(shù)據(jù)存儲模塊以及信息展示模塊連接,用于利用單片機或中央處理器協(xié)調控制所述基于大數(shù)據(jù)平臺的信息展示系統(tǒng)各個模塊的正常工作;
所述利用單片機或中央處理器協(xié)調控制所述基于大數(shù)據(jù)平臺的信息展示系統(tǒng)各個模塊的正常工作,包括:進行灰色模型建模,并使用建立的灰色模型進行控制;所述進行灰色模型建模包括:
X(0)為原始非負數(shù)據(jù)序列:X(0)=[x(0)(1),x(0)(2),...,x(0)(n)],對X(0)進行一次累加生成操作,得到X(0)的1-AGO序列,X(1)=[x(1)(1),x(1)(2),...,x(1)(n)],其中,
對序列X(1)進行緊鄰均值生成操作,得到X(1)的緊鄰均值生成序列Z(1),其中z(1)(k)=0.5[x(1)(k)+x(1)(k-1)],k=1,2,...,n;
得到GM(1,1)的灰色微分方程:x(0)(k)+az(1)(k)=u,以及相應的白化方程:其中,a為發(fā)展系數(shù),u為灰色作用量;
進行a、u的求解:采用最小二乘法其中,Yn=[x(0)(2)x(0)(3)...x(0)(n)]T;白化方程的解為相應的灰色微分方程的時間響應序列為:即k時刻的值
對序列進行累減生成操作,即累加生成的逆運算,記為IAGO,可得預測序列其中,
k+d時刻的預測值為:d為系統(tǒng)滯后時間;
聚類模塊,與中央控制模塊連接,用于對預處理后的所有數(shù)據(jù)進行聚類處理,得到多個分類數(shù)據(jù);
所述對預處理后的所有數(shù)據(jù)進行聚類處理,得到多個分類數(shù)據(jù),包括:
根據(jù)模糊聚類算法將數(shù)據(jù)進行分類,并計算每類的聚類中心;
FCM把n個向量xk分為c個模糊類,并求每類的聚類中心ci,從而使模糊目標函數(shù)最小;
模糊聚類的目標函數(shù)為:
其中,dij=||ci-xj||為樣本向量距離中心點的歐式距離,ci是第i類的中心,m為樣本個數(shù),j為屬性列;每一聚類中心的計算公式為:
通過隸屬度函數(shù)計算隸屬度值,構成模糊矩陣;
隸屬度函數(shù)為:
從模糊矩陣中選擇訓練樣本,作為廣義神經(jīng)網(wǎng)絡的訓練輸入;
在模糊矩陣中選擇距離中心值最小的m個樣本作為訓練樣本,通過n*m組數(shù)據(jù)作為廣義神經(jīng)網(wǎng)絡的訓練輸入;其中,n為根據(jù)模糊聚類算法將入侵數(shù)據(jù)分類的個數(shù),m為1~5之間的數(shù)據(jù);
根據(jù)廣義神經(jīng)網(wǎng)絡的訓練輸入,預測輸出入侵數(shù)據(jù)類別;所述廣義神經(jīng)網(wǎng)絡由輸入層、模式層、求和層和輸出層四級結構組成;
將數(shù)據(jù)重新分為n類,找出最靠近每類中心值的樣本作為訓練樣本;得出聚類結果;
語義特征提取模塊,與中央控制模塊連接,用于對聚類得到的每個分類數(shù)據(jù)進行語義特征提取,包括:將各個分類數(shù)據(jù)聚類關鍵詞進行詞嵌入向量轉換,獲得對應的聚類關鍵詞第一語義向量;通過特征提取模型對所述第一語義向量進行語義特征提取;
驗證模塊,與中央控制模塊連接,用于將各個分類提取的語義特征與輸入的內容關鍵詞進行對比,判斷是否存在聯(lián)系;
數(shù)據(jù)篩選模塊,與中央控制模塊連接,用于基于驗證結果,保留存在聯(lián)系的數(shù)據(jù),并刪除無聯(lián)系的數(shù)據(jù);
數(shù)據(jù)融合模塊,與中央控制模塊連接,用于挖掘所有存在聯(lián)系的分類數(shù)據(jù)的關系,建立映射將各個具備聯(lián)系的分類數(shù)據(jù)進行數(shù)據(jù)融合;
分析模塊,與中央控制模塊連接,用于對數(shù)據(jù)融合后的數(shù)據(jù)進行智能分析處理;
展示參數(shù)設置模塊,與中央控制模塊連接,用于進行展示參數(shù)的獲取;同時也可用于搜索用戶的歷史行為數(shù)據(jù)獲取用戶偏好展示參數(shù);
數(shù)據(jù)存儲模塊,與中央控制模塊連接,用于通過存儲器存儲獲取的展示參數(shù)或偏好展示參數(shù)進行數(shù)據(jù)融合結果以及數(shù)據(jù)分析結果;
信息展示模塊,與中央控制模塊連接,用于利用顯示設備基于獲取的展示參數(shù)或偏好展示參數(shù)進行數(shù)據(jù)融合結果以及數(shù)據(jù)分析結果的顯示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶第二師范學院,未經(jīng)重慶第二師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110498623.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





