[發(fā)明專利]一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410730979.8 | 申請(qǐng)日: | 2014-12-05 |
| 公開(公告)號(hào): | CN104408157A | 公開(公告)日: | 2015-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 吳雪;黃正強(qiáng);劉明所 | 申請(qǐng)(專利權(quán))人: | 四川誠(chéng)品電子商務(wù)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 成都金英專利代理事務(wù)所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 610042 四川省成都市*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)絡(luò) 輿情 漏斗 數(shù)據(jù) 采集 分析 推送 系統(tǒng) 方法 | ||
1.一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng),包括網(wǎng)絡(luò)輿情采集模塊、網(wǎng)絡(luò)輿情處理模塊和網(wǎng)絡(luò)輿情發(fā)布模塊,其特征在于:所述網(wǎng)絡(luò)輿情采集模塊包括定向精確采集子模塊和非定向采集子模塊,所述定向精確采集子模塊,用于采集新聞、論壇、微博、博客、電子報(bào)、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn),保證重要信息第一時(shí)間優(yōu)先采集不丟失;所述非定向采集子模塊,用于采集百度、GOOGLE、360當(dāng)前主流搜索引擎數(shù)據(jù),進(jìn)行輿情數(shù)據(jù)搜索采集補(bǔ)充,保證了信息收集的全面性;??????
所述網(wǎng)絡(luò)輿情處理模塊包括熱點(diǎn)和敏感話題識(shí)別子模塊、主題跟蹤子模塊、自動(dòng)摘要子模塊和綜合分析子模塊;所述熱點(diǎn)和敏感話題識(shí)別子模塊用于根據(jù)系統(tǒng)內(nèi)設(shè)置的與我相關(guān)、輿情、正負(fù)面三大類關(guān)鍵詞詞庫(kù)識(shí)別出給定時(shí)間段內(nèi)的熱門話題、敏感話題以及正負(fù)面輿情信息;所述主題跟蹤子模塊用于分析新發(fā)表文章、帖子的話題是否與已有主題相同;所述自動(dòng)摘要子模塊用于對(duì)各類主題,各類傾向形成自動(dòng)摘要;所述綜合分析子模塊,用于根據(jù)形成的自動(dòng)摘要,分析某個(gè)主題在不同時(shí)段間的關(guān)注程度,預(yù)測(cè)發(fā)展趨勢(shì);對(duì)突發(fā)事件進(jìn)行跨時(shí)間、跨空間綜合分析,獲知事件發(fā)生的全貌并預(yù)測(cè)事件發(fā)展的趨勢(shì);
所述網(wǎng)絡(luò)輿情發(fā)布模塊包括輿情預(yù)警子模塊和多維度輿情信息展示子模塊,所述輿情預(yù)警子模塊用于對(duì)突發(fā)事件、涉及內(nèi)容安全的敏感話題及時(shí)發(fā)現(xiàn)并報(bào)警,所述多維度輿情信息展示子模塊,用于對(duì)輿情分析結(jié)果形成簡(jiǎn)報(bào)、報(bào)告、圖表,自動(dòng)推送給用戶。
2.網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:包括以下步驟:
(1)網(wǎng)絡(luò)輿情采集:對(duì)境內(nèi)外網(wǎng)絡(luò)中的新聞網(wǎng)頁(yè)、論壇、微博、博客、電子報(bào)、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn)進(jìn)行定向精確采集,對(duì)百度、GOOGLE、360主流搜索引擎數(shù)據(jù)進(jìn)行非定向采集,對(duì)采集回的信息進(jìn)行去重、過濾后存入采集數(shù)據(jù)庫(kù);
(2)網(wǎng)絡(luò)輿情處理,包括以下子步驟:
S1、系統(tǒng)對(duì)采集數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析,根據(jù)與我相關(guān)詞庫(kù)進(jìn)行分析是否與我相關(guān),分出與我有關(guān)的信息和與我無關(guān)的信息;
S2、系統(tǒng)對(duì)與我有關(guān)的信息進(jìn)行分析,根據(jù)輿情詞庫(kù)分析是否屬于輿情信息,分出輿情信息和非輿情信息;
S3、系統(tǒng)對(duì)輿情信息進(jìn)行分析,根據(jù)本條輿情信息出處的站點(diǎn)級(jí)別數(shù)、本條輿情正負(fù)關(guān)鍵詞級(jí)別數(shù)、本條輿情數(shù)據(jù)相似度和相關(guān)度進(jìn)行聚類后的總條數(shù),三個(gè)數(shù)據(jù)相乘積得到本條輿情信息的熱點(diǎn)值,識(shí)別出熱點(diǎn)信息和非熱點(diǎn)信息;
S4、系統(tǒng)根據(jù)正負(fù)面詞庫(kù),采用自然語(yǔ)言智能分詞技術(shù),識(shí)別出信息的正負(fù)面關(guān)系,分出負(fù)面信息和非負(fù)面信息;所述正負(fù)面詞庫(kù)包括情感語(yǔ)料庫(kù)和正負(fù)面輿情詞典;
S5、系統(tǒng)進(jìn)行主題跟蹤,分析新發(fā)布的文章、帖子的話題是否與已有的主題相同;對(duì)各類主題形成自動(dòng)摘要;系統(tǒng)將采集回來的信息進(jìn)行輿情關(guān)鍵詞統(tǒng)計(jì)分析出輿情關(guān)鍵詞的分布情況并進(jìn)行關(guān)鍵詞聚類處理,對(duì)文章標(biāo)題相似度進(jìn)行綜合分析比較判斷生成相似度關(guān)聯(lián)數(shù)據(jù),實(shí)現(xiàn)對(duì)某一事件主題跟蹤分析;
S6、系統(tǒng)根據(jù)形成的自動(dòng)摘要,分析某個(gè)主題在不同時(shí)段間的關(guān)注程度,預(yù)測(cè)發(fā)展趨勢(shì);系統(tǒng)輿情庫(kù)中詳細(xì)記錄有每條輿情信息的發(fā)布時(shí)間,站點(diǎn)和載體信息資料,通過主題跟蹤分析算法,分析出某一個(gè)事件主題的詳細(xì)的輿情傳播途徑以及傳播載體,統(tǒng)計(jì)出輿情在什么時(shí)間段和什么載體上所出現(xiàn)的頻率以及概率值,生成一個(gè)直觀的輿情發(fā)展趨勢(shì)圖;
S7、系統(tǒng)對(duì)突發(fā)事件進(jìn)行跨時(shí)間、跨空間綜合分析,系統(tǒng)將每條采集回來的輿情數(shù)據(jù)進(jìn)行聚類整合分析出輿情正負(fù)面級(jí)別、發(fā)布在各站點(diǎn)時(shí)間、發(fā)布在各站點(diǎn)的頻率以及根據(jù)發(fā)布時(shí)間形成的時(shí)間和站點(diǎn)的輿情傳播途徑這些熱點(diǎn)因素,并按照突發(fā)輿情事件的性質(zhì)、嚴(yán)重程度、擴(kuò)散速度、影響范圍、持續(xù)時(shí)間要素自動(dòng)將突發(fā)輿情事件分為特別重大輿情事件、重大輿情事件、較大輿情事件和一般輿情事件;
S8、系統(tǒng)根據(jù)突發(fā)輿情事件的級(jí)別,進(jìn)行輿情預(yù)警;
(3)網(wǎng)絡(luò)輿情發(fā)布:系統(tǒng)透過圖表分析趨勢(shì),掌握潛在的變化規(guī)律,對(duì)輿情分析結(jié)果形成簡(jiǎn)報(bào)、報(bào)告、圖表等方式,自動(dòng)推送給用戶所關(guān)心的輿情信息。
3.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:步驟(1)所述的采集方法是采用互聯(lián)網(wǎng)信息采集、文本挖掘技術(shù)和全文檢索技術(shù)采集信息。
4.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:步驟(2)所述的輿情預(yù)警包括短信預(yù)警、郵件預(yù)警、彈窗預(yù)警。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川誠(chéng)品電子商務(wù)有限公司,未經(jīng)四川誠(chéng)品電子商務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410730979.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種輿情信息獲取方法及裝置
- 一種輿情歸并方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)
- 企業(yè)輿情監(jiān)測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種輿情數(shù)據(jù)推送方法、裝置、存儲(chǔ)介質(zhì)和終端設(shè)備
- 一種輿情分析方法
- 輿情分析方法、裝置、終端設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 知識(shí)庫(kù)構(gòu)建方法及裝置
- 生成輿情專題方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈、輿情和核心算法的金融風(fēng)控系統(tǒng)
- 網(wǎng)絡(luò)輿情云平臺(tái)用戶單位變更配置的方法及系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





