[發明專利]一種基于數據庫同步的輿情分析系統優化方法在審
| 申請號: | 201410248277.6 | 申請日: | 2014-06-06 |
| 公開(公告)號: | CN103984777A | 公開(公告)日: | 2014-08-13 |
| 發明(設計)人: | 程瑤;劉粉粉;陳大雅 | 申請(專利權)人: | 浪潮電子信息產業股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據庫 同步 輿情 分析 系統 優化 方法 | ||
1.一種基于數據庫同步的輿情分析系統優化方法,其特征在于,?在數據庫同步環節對數據進行篩選,通過控制進入輿情分析系統的數據,進行輿情分析系統優化;所述輿情分析系統優化方法提出了一種優化輿情分析系統,所述優化輿情分析系統的體系結構包括:數據庫模塊、數據同步模塊和輿情分析系統;其中,
所述數據庫模塊是存儲輿情信息的模塊,所述數據庫模塊為輿情采集系統的一部分,是最終存儲采集信息的模塊;
所述數據同步模塊是數據庫模塊和輿情分析系統的橋梁,通過該數據同步模塊把輿情信息傳送到輿情分析系統里;所述數據同步模塊中包括分詞庫、輿情包含詞庫、輿情排除詞庫,所述輿情包含詞庫里包括典型輿情詞匯,所述輿情排除詞庫里包括典型的非輿情詞匯;
所述輿情分析系統提供輿情分析功能;
所述輿情分析系統優化方法,在采集信息導入輿情分析系統時,加入了信息篩選過濾操作,只往輿情分析系統中導入輿情信息;即在數據庫同步時,在數據同步模塊中添加輿情包含詞庫、輿情排除詞庫信息,對采集信息進行詞匯對比過濾,通過在這兩種不同的詞庫之間過濾信息的邏輯關系,把數據庫模塊中的信息篩選過濾出來,只把通過篩選的信息導入到輿情分析系統里,進行輿情分析。
2.根據權利要求1所述的一種基于數據庫同步的輿情分析系統優化方法,其特征在于,在數據庫同步時,在數據同步模塊中加入輿情包含詞庫、輿情排除詞庫信息,對采集信息進行詞匯對比過濾,通過在這兩種不同的詞庫之間過濾信息的邏輯關系,具體包括:把數據庫模塊中的信息分詞后,先后比對輿情包含詞庫、輿情排除詞庫中的詞匯,判斷這條信息的詞匯是否匹配輿情包含詞庫且不匹配輿情排除詞庫,若這條信息的詞匯里有輿情包含詞庫詞匯且沒有輿情排除詞庫的詞匯,則這條信息是輿情信息,只把通過篩選的輿情信息導入到輿情分析系統里,進行輿情分析。
3.根據權利要求2所述的一種基于數據庫同步的輿情分析系統優化方法,其特征在于,該輿情分析系統優化方法的具體實施流程如下:
首先在數據庫同步時,從數據庫模塊里獲取一條待處理的信息;
通過分詞庫對待處理信息進行分詞處理;
判斷這條信息分成的詞匯里是否和輿情包含詞庫有相同的詞;
若有,則這條信息暫時符合輿情信息標準,進入第5步操作;若沒有,則這條消息不是輿情信息,消息丟棄,進行第1步操作;
判斷該條信息分成的詞匯里是否和輿情排除詞庫有相同的詞;
若沒有,則這條信息是輿情信息,把這條信息存入輿情分析系統;若有,則這條消息不是輿情信息,消息丟棄,進行第1步操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮電子信息產業股份有限公司,未經浪潮電子信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410248277.6/1.html,轉載請聲明來源鉆瓜專利網。





