[發(fā)明專利]一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法在審
| 申請?zhí)枺?/td> | 201910488085.5 | 申請日: | 2019-06-05 |
| 公開(公告)號: | CN110399455A | 公開(公告)日: | 2019-11-01 |
| 發(fā)明(設(shè)計)人: | 肖清林 | 申請(專利權(quán))人: | 福建奇點時空數(shù)字科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06N3/04 |
| 代理公司: | 北京勁創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11589 | 代理人: | 王志敏 |
| 地址: | 361000 福建省廈門市軟件園*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 算法模型 數(shù)據(jù)挖掘 信息調(diào)取 學(xué)習(xí)數(shù)據(jù) 構(gòu)建 數(shù)據(jù)預(yù)處理 原始數(shù)據(jù)包 傳統(tǒng)信息 快速識別 目標(biāo)對象 數(shù)據(jù)反饋 特征向量 相關(guān)信息 信息獲取 學(xué)習(xí)效果 重復(fù)模塊 字符信息 信息庫 挖掘 調(diào)取 延展 測試 學(xué)習(xí) 補充 幫助 | ||
一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法,包括以下步驟:依次收集每個目標(biāo)對象的特征向量,得到原始數(shù)據(jù)包;對數(shù)據(jù)預(yù)處理,建立字符信息庫;構(gòu)建CNN?LSTM算法模型;對CNN?LSTM算法模型進(jìn)行訓(xùn)練,并測試;采用CNN?LSTM算法模型進(jìn)行數(shù)據(jù)挖掘;得到數(shù)據(jù)反饋,進(jìn)行學(xué)習(xí)。本發(fā)明中,通過構(gòu)建LSTM?CNN算法模型在學(xué)習(xí)時完成數(shù)據(jù)挖掘,大大提高了信息獲取的效率,解決傳統(tǒng)信息調(diào)取困難的問題,幫助學(xué)習(xí)者提高學(xué)習(xí)效果;其中CNN對關(guān)鍵詞對應(yīng)的字符信息進(jìn)行快速識別,LSTM采用重復(fù)模塊鏈的形式對關(guān)鍵詞的相關(guān)信息快速延展、補充,使得信息調(diào)取速度快,信息調(diào)取準(zhǔn)確性高。
技術(shù)領(lǐng)域
本發(fā)明涉及學(xué)習(xí)領(lǐng)域,尤其涉及一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法。
背景技術(shù)
目前,各地區(qū)各部門的工作已經(jīng)基本實現(xiàn)電子化。由于實現(xiàn)電子化的時間不長,信息量過于龐大,使得信息挖掘的準(zhǔn)確性低,速度慢,耽誤了各單位和個人的學(xué)習(xí)。
為解決上述問題,本申請中提出一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法。
發(fā)明內(nèi)容
(一)發(fā)明目的
為解決背景技術(shù)中存在的技術(shù)問題,本發(fā)明提出一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法,本發(fā)明通過構(gòu)建LSTM-CNN算法模型在學(xué)習(xí)時完成數(shù)據(jù)挖掘,大大提高了信息獲取的效率,解決傳統(tǒng)信息調(diào)取困難的問題,幫助學(xué)習(xí)者提高學(xué)習(xí)效果;其中CNN對關(guān)鍵詞對應(yīng)的字符信息進(jìn)行快速識別,LSTM采用重復(fù)模塊鏈的形式對關(guān)鍵詞的相關(guān)信息快速延展、補充,使得信息調(diào)取速度快,信息調(diào)取準(zhǔn)確性高。
(二)技術(shù)方案
為解決上述問題,本發(fā)明提供了一種基于CNN和LSTM的深度學(xué)習(xí)數(shù)據(jù)挖掘方法,包括以下步驟:
S1、依次收集每個目標(biāo)對象的特征向量,得到原始數(shù)據(jù)包;
S2、對數(shù)據(jù)預(yù)處理,建立字符信息庫;
S3、構(gòu)建CNN-LSTM算法模型;
S4、對CNN-LSTM算法模型進(jìn)行訓(xùn)練,并測試;
S5、采用CNN-LSTM算法模型進(jìn)行數(shù)據(jù)挖掘;
S6、得到數(shù)據(jù)反饋,進(jìn)行學(xué)習(xí)。
優(yōu)選的,在S1中,特征向量為目標(biāo)對象的多個屬性數(shù)據(jù),包括黨員姓名、身份證信息、黨籍、入黨時間、入黨年限、職務(wù)、工作所在地。
優(yōu)選的,在S2中,數(shù)據(jù)預(yù)處理的方式為:以姓名、身份證和黨員信息為主要關(guān)鍵詞,對原始數(shù)據(jù)包中的數(shù)據(jù)進(jìn)行分類,并將數(shù)據(jù)格式轉(zhuǎn)換為預(yù)設(shè)格式,得到字符信息庫。
優(yōu)選的,在S3中,CNN神經(jīng)網(wǎng)絡(luò)系統(tǒng)和LSTM神經(jīng)網(wǎng)絡(luò)系統(tǒng)為串聯(lián)建模。
優(yōu)選的,在S4中,構(gòu)造的CNN模型包括輸入層、卷積層、全連接層和輸出層;其中輸入層輸入的一維數(shù)據(jù)序列的長度為2k+1;卷積層中卷積核為一維結(jié)構(gòu),其大小為2k+1;全連接層搭建在CNN模型的最后部分;輸出層設(shè)置在全連接層的下游。
優(yōu)選的,在S4中,LSTM包含長短記憶層和至少一個全連接層。
優(yōu)選的,在S5中進(jìn)行數(shù)據(jù)挖掘時,首先輸入關(guān)鍵詞,CNN對關(guān)鍵詞對應(yīng)的字符信息進(jìn)行快速識別,LSTM采用重復(fù)模塊鏈的形式對關(guān)鍵詞的相關(guān)信息快速延展、補充。
優(yōu)選的,還包括校正系統(tǒng);在S6中,學(xué)習(xí)者得到反饋的數(shù)據(jù),再根據(jù)數(shù)據(jù)的準(zhǔn)確性進(jìn)行校正,不斷完善模型。
優(yōu)選的,還包括記錄系統(tǒng);記錄系統(tǒng)對挖掘的數(shù)據(jù)內(nèi)容、時間、頻率進(jìn)行記錄,根據(jù)統(tǒng)計情況對學(xué)習(xí)者進(jìn)行優(yōu)先推送,減小數(shù)據(jù)挖掘的時間。
本發(fā)明的上述技術(shù)方案具有如下有益的技術(shù)效果:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建奇點時空數(shù)字科技有限公司,未經(jīng)福建奇點時空數(shù)字科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910488085.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)挖掘方法及設(shè)備
- 數(shù)據(jù)挖掘算法動態(tài)插入到數(shù)據(jù)挖掘平臺的方法及系統(tǒng)
- 基于MPP的并行數(shù)據(jù)挖掘系統(tǒng)及其實現(xiàn)方法
- 數(shù)據(jù)挖掘方法和裝置
- 一種解耦WEB客戶端與大數(shù)據(jù)挖掘分析的數(shù)據(jù)挖掘平臺及實現(xiàn)方法
- 大數(shù)據(jù)挖掘方法、裝置及數(shù)據(jù)挖掘服務(wù)器
- 一種數(shù)據(jù)挖掘系統(tǒng)及方法
- 一種大數(shù)據(jù)挖掘系統(tǒng)
- 一種基于數(shù)據(jù)庫的雙向數(shù)據(jù)挖掘方法和裝置
- 一種數(shù)據(jù)挖掘方法和裝置
- 計費方法、計費裝置和計費系統(tǒng)
- 一種貨品調(diào)取方法及裝置
- 一種傾斜影像立體測圖方法
- 監(jiān)控信息調(diào)取方法、系統(tǒng)及種植設(shè)備
- 一種設(shè)置在移動終端的電視頻道控制方法及系統(tǒng)
- 遠(yuǎn)程面簽錄屏調(diào)取方法、裝置、存儲介質(zhì)及計算機(jī)設(shè)備
- 一種農(nóng)業(yè)產(chǎn)品信息儲存調(diào)取系統(tǒng)
- 運動狀態(tài)信息提示方法及運動狀態(tài)信息提示裝置
- 一種配電網(wǎng)絡(luò)中的各臺區(qū)電力信息調(diào)取系統(tǒng)
- 有線數(shù)字電視錄像的調(diào)取方法、系統(tǒng)、介質(zhì)和電子設(shè)備
- 學(xué)習(xí)處理方法和學(xué)習(xí)處理裝置以及程序
- 學(xué)習(xí)數(shù)據(jù)獲取設(shè)備和方法、程序和存儲介質(zhì)
- 機(jī)器學(xué)習(xí)設(shè)備和使用其的機(jī)器學(xué)習(xí)系統(tǒng)
- 消息輸出裝置、學(xué)習(xí)裝置、消息輸出方法、學(xué)習(xí)方法和程序
- 基于學(xué)習(xí)的數(shù)據(jù)處理系統(tǒng)及模型更新方法
- 圖像判定裝置、圖像判定方法及圖像判定程序
- 一種基于VueJS的學(xué)生學(xué)習(xí)數(shù)據(jù)存儲方法及裝置
- 一種學(xué)習(xí)數(shù)據(jù)整合方法及裝置
- 精準(zhǔn)學(xué)習(xí)數(shù)據(jù)挖掘
- 精準(zhǔn)授課數(shù)據(jù)挖掘





