[發(fā)明專利]一種基于大數(shù)據(jù)的科技信息聚類方法在審
| 申請?zhí)枺?/td> | 202010150066.4 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111460046A | 公開(公告)日: | 2020-07-28 |
| 發(fā)明(設計)人: | 丁榮榮 | 申請(專利權)人: | 合肥海策科技信息服務有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/215;G06F16/245 |
| 代理公司: | 合肥律通專利代理事務所(普通合伙) 34140 | 代理人: | 吳奇 |
| 地址: | 230601 安徽省合肥市經(jīng)*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數(shù)據(jù) 科技 信息 方法 | ||
1.一種基于大數(shù)據(jù)的科技信息聚類方法,其特征在于,包括以下步驟:
S1、采集用戶行為歷史數(shù)據(jù):客戶端采集用戶數(shù)據(jù),并上傳到云端服務器上;采集數(shù)據(jù)包括用戶輸入的關鍵詞和瀏覽行為以及個人的基本信息;
S2、用戶行為特征分析處理:對用戶數(shù)據(jù)進行預處理和聚合處理,過濾掉不完整的數(shù)據(jù)以及垃圾無用數(shù)據(jù),并將行為特征完整有用數(shù)據(jù)保存到大數(shù)據(jù)中;
S3、建立用戶行為特征集:系統(tǒng)分析模塊對用戶行為進行分析,提取用戶經(jīng)常瀏覽的行為信息,綜合用戶基本信息,建立用戶行為特征集;
S4、建立大數(shù)據(jù)聚類模型:利用深度學習算法、機器學習算法及語義分析算法對用戶數(shù)據(jù)中心進行深度分析,并建立大數(shù)據(jù)聚類模型算法模型;
S5、利用聚類模型對數(shù)據(jù)集進行聚類處理:從大數(shù)據(jù)庫中檢索出基于分析模塊分析出的與用戶行為相關的科技信息資源,并對子數(shù)據(jù)進行局部聚類;
S6、科技信息推送:數(shù)據(jù)推送模塊將將局部聚類后的信息資源推送給用戶。
2.根據(jù)權利要求1所述的一種基于大數(shù)據(jù)的科技信息聚類方法,其特征在于:所述科技信息可以是知識產(chǎn)權、科技論文、科技項目、科技成果、技術標準、科學數(shù)據(jù)、信息情報、新產(chǎn)品。
3.根據(jù)權利要求1所述的一種基于大數(shù)據(jù)的科技信息聚類方法,其特征在于:所述大數(shù)據(jù)聚類模型可以是k-means模型、MapReduce模型中的一種。
4.根據(jù)權利要求1所述的一種基于大數(shù)據(jù)的科技信息聚類方法,其特征在于:所述步驟S5包括以下分步驟:
S51、對科技信息原始數(shù)據(jù)集進行預處理;
S52、將數(shù)據(jù)U分割為M個子數(shù)據(jù)集,并分配給M個Map函數(shù);
S53、在Map處理過程中,對子數(shù)據(jù)進行局部聚類;
S54、在Reduce處理過程中,對相同key/Value值的類進行合并;
S55、如果實際聚類個數(shù)R小于聚類個數(shù)k,則需要調(diào)整收縮因子參數(shù),重新進行聚類,直到實際聚類個數(shù)R等于聚類個數(shù)k為止;
S56、如果N新>N舊||K新>K舊,那么兩個數(shù)據(jù)集重新進行分割,K=[(K新+K舊)/2];反之,沒更新的數(shù)據(jù)集得到的K個簇的中心點作為K個點與新數(shù)據(jù)源組成新的數(shù)據(jù)集進行分割,K=K舊;其中,N新和N舊分別表示新數(shù)據(jù)源點數(shù)和沒有更新前數(shù)據(jù)源點數(shù),K新和K舊分別表示新數(shù)據(jù)源中心點個數(shù)和沒有更新前數(shù)據(jù)源中心點個數(shù);
S57、重復S53、S54、S55階段直到實際聚類個數(shù)R等于聚類個數(shù)k為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥海策科技信息服務有限公司,未經(jīng)合肥海策科技信息服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010150066.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





