[發(fā)明專利]一種基于大數(shù)據(jù)分析的政策信息服務(wù)系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202010152980.2 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111400369A | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計)人: | 劉合安 | 申請(專利權(quán))人: | 湖南城市學(xué)院 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28;G06F16/215;G06F16/245;G06Q50/26 |
| 代理公司: | 長沙新裕知識產(chǎn)權(quán)代理有限公司 43210 | 代理人: | 劉熙 |
| 地址: | 413000 *** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 分析 政策 信息 服務(wù) 系統(tǒng) 方法 | ||
1.一種基于大數(shù)據(jù)分析的政策信息服務(wù)方法,其特征在于,所述基于大數(shù)據(jù)分析的政策信息服務(wù)方法包括:
步驟一,利用大數(shù)據(jù)挖掘技術(shù)從各個政務(wù)公開網(wǎng)站獲取最新政策文件以及相關(guān)信息;利用大數(shù)據(jù)分析處理技術(shù)對獲取到的各個政策文件、相關(guān)信息進(jìn)行預(yù)處理并獲取從各個政務(wù)公開網(wǎng)站獲取最新政策文件以及相關(guān)數(shù)據(jù)信息;
步驟二,對獲取到的相關(guān)文件、數(shù)據(jù)信息進(jìn)行數(shù)據(jù)來源驗證,驗證通過則轉(zhuǎn)向步驟三,驗證未通過則刪除相關(guān)數(shù)據(jù);
步驟三,對驗證來源通過的數(shù)據(jù)進(jìn)行去重、過濾、歸一化處理;首先由數(shù)據(jù)處理模塊計算需要存儲文件的文件特征和每個數(shù)據(jù)塊的指紋,然后將文件特征指紋與每個數(shù)據(jù)塊指紋發(fā)送給主節(jié)點(diǎn)單元;所述數(shù)據(jù)指紋是通過哈希函數(shù)生成的散列值,能唯一標(biāo)識生成該數(shù)據(jù)指紋的數(shù)據(jù)塊,具有全局唯一性;
步驟四,由主節(jié)點(diǎn)單元根據(jù)該文件特征指紋去主索引中檢索;所述的主索引為key-value鍵值對的數(shù)據(jù)結(jié)構(gòu),key為文檔特征指紋,代表某一類文件,value為該指向類文件的相似性集合的指針,指向某一特定文件的相似性集合,即指向從索引;
步驟五,如果未檢索到與該文件特征指紋相同的記錄,則表明該文件為一新文件;若檢索到已存在與該文件特征指紋相同的記錄,則表明存在同類型的文件數(shù)據(jù)存在,則將此文件進(jìn)行刪除;
步驟六,基于步驟三至步驟五提取到的文件標(biāo)簽以及自定義分類屬性進(jìn)行政策的分類匯總;基于大數(shù)據(jù)分析技術(shù)對預(yù)處理后的政策文件以及相關(guān)信息內(nèi)容進(jìn)行多維度分析;
步驟七,利用數(shù)據(jù)庫存儲獲取到的相關(guān)政策文件,并建立政策文件關(guān)鍵詞和政策文檔之間的索引映射關(guān)系表;進(jìn)行政策信息的實(shí)時更新;所述建立政策文件關(guān)鍵詞和政策文檔之間的索引映射關(guān)系表包括:獲取各個政策文件以及相關(guān)數(shù)據(jù)信息的標(biāo)簽;基于大數(shù)據(jù)分析技術(shù)計算各個政策文件以及相關(guān)數(shù)據(jù)信息中某個標(biāo)簽出現(xiàn)的次數(shù),將標(biāo)簽出現(xiàn)次數(shù)與文檔編號建立索引關(guān)系;
基于建立的索引關(guān)系通過行列運(yùn)算計算相對于標(biāo)簽的文檔相關(guān)性排序;基于建立的索引關(guān)系按照相關(guān)性排序結(jié)果構(gòu)建索引映射關(guān)系表;
步驟八,通過自定義查詢條件或輸入查詢關(guān)鍵詞查詢相關(guān)政策文件,并輸出查詢報表;針對查詢過或正在查詢的政策文件提供數(shù)據(jù)反饋通道,收集針對查看的政策的相關(guān)意見或建議信息,并進(jìn)行信息反饋。
2.如權(quán)利要求1所述基于大數(shù)據(jù)分析的政策信息服務(wù)方法,其特征在于,所述步驟三中的哈希函數(shù)采用的為SHA-1算法。
3.如權(quán)利要求1所述基于大數(shù)據(jù)分析的政策信息服務(wù)方法,其特征在于,所述步驟八中,根據(jù)定義統(tǒng)計條件進(jìn)行政策信息及相關(guān)數(shù)據(jù)文件的統(tǒng)計,并生成統(tǒng)計報表;同時閱閱覽相關(guān)政策信息,基于自定義的政策訂閱條件進(jìn)行相關(guān)政策的定制提醒;同時針對感興趣或正在查看的政策文件提供相應(yīng)政策解讀文件或相關(guān)數(shù)據(jù)鏈接。
4.如權(quán)利要求3所述基于大數(shù)據(jù)分析的政策信息服務(wù)方法,其特征在于,所述基于自定義的政策訂閱條件進(jìn)行相關(guān)政策的定制提醒方法包括:
步驟1,自定義的政策訂閱條件;
步驟2,提取訂閱條件中有關(guān)政策的相關(guān)關(guān)鍵詞;
步驟3,根據(jù)提取到的關(guān)鍵詞在政策文件關(guān)鍵詞和政策文檔之間的索引映射關(guān)系表中進(jìn)行檢索;
步4,輸出與訂閱關(guān)鍵詞相匹配的政策文件或相關(guān)信息。
5.一種基于大數(shù)據(jù)分析的政策信息服務(wù)系統(tǒng),其特征在于,所述基于大數(shù)據(jù)分析的政策信息服務(wù)系統(tǒng)包括:
數(shù)據(jù)挖掘模塊,用于基于大數(shù)據(jù)挖掘技術(shù)從各個政務(wù)公開網(wǎng)站獲取最新政策文件以及相關(guān)信息;
數(shù)據(jù)處理模塊,用于利用大數(shù)據(jù)分析處理技術(shù)對獲取到的各個政策文件、相關(guān)信息進(jìn)行預(yù)處理,
數(shù)據(jù)提取模塊,用于基于大數(shù)據(jù)分析技術(shù)對預(yù)處理后的政策文件以及相關(guān)信息內(nèi)容進(jìn)行多維度分析,所述多維度分析包括:對預(yù)處理后的政策文件以及相關(guān)信息內(nèi)容按照發(fā)布機(jī)構(gòu)、發(fā)布時間、政策有效時間、行業(yè)領(lǐng)域、區(qū)域?qū)蛹墶⑵髽I(yè)性質(zhì)、扶持關(guān)鍵字、扶持強(qiáng)度金額以及其他維度進(jìn)行分析;
數(shù)據(jù)分類模塊,用于提取到的文件標(biāo)簽以及自定義分類屬性進(jìn)行政策的分類匯總。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南城市學(xué)院,未經(jīng)湖南城市學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010152980.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





