[發(fā)明專利]一種基于大數(shù)據(jù)的科技信息聚類方法在審
| 申請?zhí)枺?/td> | 202010150066.4 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111460046A | 公開(公告)日: | 2020-07-28 |
| 發(fā)明(設(shè)計)人: | 丁榮榮 | 申請(專利權(quán))人: | 合肥海策科技信息服務(wù)有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/215;G06F16/245 |
| 代理公司: | 合肥律通專利代理事務(wù)所(普通合伙) 34140 | 代理人: | 吳奇 |
| 地址: | 230601 安徽省合肥市經(jīng)*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 科技 信息 方法 | ||
本發(fā)明公開了一種基于大數(shù)據(jù)的科技信息聚類方法,包括以下步驟:采集用戶行為歷史數(shù)據(jù);用戶行為特征分析處理;建立用戶行為特征集;建立大數(shù)據(jù)聚類模型;利用聚類模型對數(shù)據(jù)集進(jìn)行聚類處理;將聚類后的信息資源推送給用戶。本發(fā)明利用云計算的高性能集群系統(tǒng)的并行計算能力來解決科技信息聚類面臨的大數(shù)據(jù)處理問題,基于云計算的大數(shù)據(jù)挖掘開發(fā)方便,以并行聚類為目標(biāo),屏蔽了底層,提高對大規(guī)模數(shù)據(jù)的處理能力和速度,實(shí)現(xiàn)了云計算對數(shù)據(jù)挖掘中聚類分析的作用,避免簡單基于文本近似來進(jìn)行科技信息推薦,使得科技人員獲得更為全面、精準(zhǔn)的信息。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種基于大數(shù)據(jù)的科技信息聚類方法。
背景技術(shù)
科技信息是記載科學(xué)技術(shù)活動、科技知識的信息載體;是記錄和傳播科技信息的主要手段,也是幫助人們認(rèn)識客觀事物、啟發(fā)思路、尋求技術(shù)支持的重要工具。科技信息包括知識產(chǎn)權(quán)、科技論文、科技項(xiàng)目、科技成果、技術(shù)標(biāo)準(zhǔn)、科學(xué)數(shù)據(jù)、信息情報、新產(chǎn)品等。目前隨著社會科技水平的進(jìn)步,科技信息數(shù)據(jù)量呈爆炸性增長。科技信息數(shù)據(jù)無論是開發(fā)還是使用,都離不開網(wǎng)絡(luò)技術(shù)的支撐。但目前網(wǎng)絡(luò)上的科技信息繁雜,全面性和準(zhǔn)確性不高,導(dǎo)致科技企業(yè)和科技人員不容易直接獲得真實(shí)有價值的信息。科技信息碎片化與科技人員時間碎片化、信息需求個性化和多樣化之間存在著很大的矛盾,另外終端設(shè)備由PC轉(zhuǎn)向手持智能終端,也導(dǎo)致科技人員對科技信息展示和推薦的智能化需求也越來越高。如果能夠過濾無用信息,并對各種科技信息進(jìn)行有效分類和提煉,實(shí)現(xiàn)對科技企業(yè)和科技人員的精準(zhǔn)和高質(zhì)量信息推薦,日益變得重要。
現(xiàn)有技術(shù)中,專利CN201310173534.X提供了提供了一種科技信息自動分類篩選的方法,其主要解決的問題是解決現(xiàn)有搜索技術(shù)基于各個單一的詞語而不是對整個頁面概括的弊端,提高了信息檢索的效率,保證數(shù)據(jù)抓取的完整性和可靠性;專利CN201410150100.2提供一種用于科技信息垂直搜索的異構(gòu)數(shù)據(jù)分析方法,其主要解決的問題是提高垂直搜索的準(zhǔn)確度,使得用戶更容易獲取符合實(shí)際需求的信息。雖然以上技術(shù)所針對領(lǐng)域比較接近,設(shè)計思想各有特點(diǎn),但這些方法都是針對科技信息搜索的,均不是針對科技信息大數(shù)據(jù)處理而設(shè)計的,也不符合實(shí)現(xiàn)科技信息智能化聚類推薦的要求。目前,科技信息的推薦仍然是簡單基于文本近似來進(jìn)行推薦,而科技人員希望獲得的是更為全面、精準(zhǔn)的信息,這也導(dǎo)致了目前科技信息推薦的效果不理想。
因此,發(fā)明一種基于大數(shù)據(jù)的科技信息聚類方法來解決上述問題很有必要。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于大數(shù)據(jù)的科技信息聚類方法,以解決上述背景技術(shù)中提出的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于大數(shù)據(jù)的科技信息聚類方法,其特征在于,包括以下步驟:
S1、采集用戶行為歷史數(shù)據(jù):客戶端采集用戶數(shù)據(jù),并上傳到云端服務(wù)器上;采集數(shù)據(jù)包括用戶輸入的關(guān)鍵詞和瀏覽行為以及個人的基本信息;
S2、用戶行為特征分析處理:對用戶數(shù)據(jù)進(jìn)行預(yù)處理和聚合處理,過濾掉不完整的數(shù)據(jù)以及垃圾無用數(shù)據(jù),并將行為特征完整有用數(shù)據(jù)保存到大數(shù)據(jù)中;
S3、建立用戶行為特征集:系統(tǒng)分析模塊對用戶行為進(jìn)行分析,提取用戶經(jīng)常瀏覽的行為信息,綜合用戶基本信息,建立用戶行為特征集;
S4、建立大數(shù)據(jù)聚類模型:利用深度學(xué)習(xí)算法、機(jī)器學(xué)習(xí)算法及語義分析算法對用戶數(shù)據(jù)中心進(jìn)行深度分析,并建立大數(shù)據(jù)聚類模型算法模型;
S5、利用聚類模型對數(shù)據(jù)集進(jìn)行聚類處理:從大數(shù)據(jù)庫中檢索出基于分析模塊分析出的與用戶行為相關(guān)的科技信息資源,并對子數(shù)據(jù)進(jìn)行局部聚類;
S6、科技信息推送:數(shù)據(jù)推送模塊將將局部聚類后的信息資源推送給用戶。
優(yōu)選的,所述科技信息可以是知識產(chǎn)權(quán)、科技論文、科技項(xiàng)目、科技成果、技術(shù)標(biāo)準(zhǔn)、科學(xué)數(shù)據(jù)、信息情報、新產(chǎn)品。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥海策科技信息服務(wù)有限公司,未經(jīng)合肥海策科技信息服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010150066.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





