[發(fā)明專利]基于網(wǎng)絡(luò)信息資源的行業(yè)分析系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201711475066.6 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108229810B | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 張海東;倪晚成 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所;中國科學(xué)院自動化研究所(洛陽)機(jī)器人與智能裝備創(chuàng)新研究院 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/26;G06F16/951;G06F16/9532;G06F40/289;G06F40/30 |
| 代理公司: | 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11482 | 代理人: | 郭文浩;陳曉鵬 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 網(wǎng)絡(luò) 信息資源 行業(yè) 分析 系統(tǒng) 方法 | ||
本發(fā)明涉及信息分析領(lǐng)域,提出了一種基于網(wǎng)絡(luò)信息資源的行業(yè)分析系統(tǒng),旨在解決行業(yè)信息分析需要消耗大量的人力物力,且無法達(dá)到實(shí)時性的問題。該系統(tǒng)包括:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)分析模塊和前臺交互模塊,其中,數(shù)據(jù)采集模塊,配置為采集與行業(yè)相關(guān)的網(wǎng)絡(luò)信息;數(shù)據(jù)預(yù)處理模塊,配置為對上述網(wǎng)絡(luò)信息進(jìn)行結(jié)構(gòu)化處理,與平臺數(shù)據(jù)進(jìn)行融合,構(gòu)建產(chǎn)業(yè)結(jié)構(gòu)樹;數(shù)據(jù)分析模塊,配置為通過自然語言處理技術(shù)和數(shù)據(jù)挖掘算法分析上述平臺數(shù)據(jù),提取與上述關(guān)鍵詞相關(guān)的數(shù)據(jù)作為交互數(shù)據(jù);前臺交互模塊,配置為于通過上述交互數(shù)據(jù)與用戶終端進(jìn)行交互。本發(fā)明實(shí)現(xiàn)從海量網(wǎng)絡(luò)信息中挖掘有價(jià)值的數(shù)據(jù),為用戶實(shí)時地呈現(xiàn)行業(yè)的分析結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)信息應(yīng)用領(lǐng)域,具體涉及網(wǎng)絡(luò)信息資源的數(shù)據(jù)挖掘應(yīng)用領(lǐng)域,特別涉及一種基于網(wǎng)絡(luò)信息資源的行業(yè)分析系統(tǒng)及方法。
背景技術(shù)
隨著信息技術(shù)的快速發(fā)展,各領(lǐng)域的信息數(shù)據(jù)呈現(xiàn)出爆炸式增長,也給這些行業(yè)的工作者帶來了巨大的挑戰(zhàn)和壓力,如何從這些海量數(shù)據(jù)中,挖掘出有價(jià)值的行業(yè)信息,實(shí)時追蹤產(chǎn)業(yè)信息變化,了解產(chǎn)業(yè)上下游分工和競爭對手的發(fā)展動向,輔助行業(yè)管理層、決策層針對市場變化,做出快速有效的應(yīng)對策略,具有重要的借鑒意義。
行業(yè)分析,是一種系統(tǒng)性的行業(yè)信息整合分析結(jié)果,對于企業(yè)發(fā)現(xiàn)行業(yè)商機(jī)、把握市場脈搏、評估投資風(fēng)險(xiǎn)等方面,具有重要的借鑒意義。通常由企業(yè)內(nèi)部或?qū)I(yè)的市場研究公司,收集相關(guān)數(shù)據(jù),并結(jié)合相關(guān)的從業(yè)經(jīng)驗(yàn)來進(jìn)行行業(yè)分析報(bào)告。由于行業(yè)分析報(bào)告需要調(diào)研后編制,需要消耗大量的人力物力,且無法達(dá)到實(shí)時性,這與瞬息萬變的信息時代,存在巨大的反差。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,即為了解決在行業(yè)分析報(bào)告需要調(diào)研后編制,需要消耗大量的人力物力,且無法達(dá)到實(shí)時性的問題,本發(fā)明采用以下技術(shù)方案以解決上述問題:
第一方面,本申請?zhí)峁┝嘶诰W(wǎng)絡(luò)信息資源的行業(yè)分析系統(tǒng),該系統(tǒng)包括:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)分析模塊和前臺交互模塊,其中,上述數(shù)據(jù)采集模塊,配置為采集與用戶所關(guān)注行業(yè)相關(guān)的網(wǎng)絡(luò)信息;上述數(shù)據(jù)預(yù)處理模塊,配置為對上述網(wǎng)絡(luò)信息進(jìn)行結(jié)構(gòu)化處理,與預(yù)設(shè)的平臺數(shù)據(jù)進(jìn)行融合,構(gòu)建產(chǎn)業(yè)結(jié)構(gòu)的領(lǐng)域知識樹和產(chǎn)業(yè)結(jié)構(gòu)的領(lǐng)域知識樹節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系;上述數(shù)據(jù)分析模塊,配置為通過自然語言處理方法和數(shù)據(jù)挖掘算法分析上述平臺數(shù)據(jù)和領(lǐng)域知識樹,提取與上述行業(yè)相關(guān)的數(shù)據(jù)作為交互數(shù)據(jù);上述前臺交互模塊,配置為通過上述交互數(shù)據(jù)與用戶終端進(jìn)行交互。
在一些示例中,上述數(shù)據(jù)采集模塊包括垂直網(wǎng)絡(luò)爬蟲和學(xué)術(shù)網(wǎng)絡(luò)爬蟲,上述垂直網(wǎng)絡(luò)爬蟲,配置為根據(jù)預(yù)設(shè)的第一初始種子節(jié)點(diǎn),通過分析統(tǒng)一資源定位符從行業(yè)垂直網(wǎng)站抓取網(wǎng)頁信息;上述學(xué)術(shù)網(wǎng)絡(luò)爬蟲,配置為根據(jù)預(yù)設(shè)的第二初始種子節(jié)點(diǎn)從學(xué)術(shù)網(wǎng)站抓取學(xué)術(shù)文章。
在一些示例中,上述數(shù)據(jù)預(yù)處理模塊包括數(shù)據(jù)結(jié)構(gòu)化子模塊、平臺數(shù)據(jù)子模塊、領(lǐng)域術(shù)語提取子模塊和領(lǐng)域知識樹子模塊,上述數(shù)據(jù)結(jié)構(gòu)化子模塊,配置為對上述垂直網(wǎng)絡(luò)爬蟲收集的垂直網(wǎng)頁信息進(jìn)行結(jié)構(gòu)化分析;上述平臺數(shù)據(jù)子模塊,配置為存儲平臺用戶以及收集的網(wǎng)絡(luò)信息數(shù)據(jù),并為上述分析模塊提供數(shù)據(jù);上述領(lǐng)域術(shù)語提取子模塊,配置為從上述學(xué)術(shù)網(wǎng)絡(luò)爬蟲所爬取的學(xué)術(shù)文章中提取領(lǐng)域相關(guān)術(shù)語;上述領(lǐng)域知識樹子模塊,配置為結(jié)合領(lǐng)域?qū)<抑R,對提取的所述領(lǐng)域術(shù)語進(jìn)行結(jié)構(gòu)化組織,構(gòu)建產(chǎn)業(yè)結(jié)構(gòu)的領(lǐng)域知識樹,并分析上述領(lǐng)域知識樹的節(jié)點(diǎn)之間的產(chǎn)業(yè)關(guān)聯(lián)關(guān)系。
在一些示例中,上述領(lǐng)域術(shù)語提取子模塊,進(jìn)一步配置為分析學(xué)術(shù)網(wǎng)絡(luò)爬蟲獲取的學(xué)術(shù)文章,使用文本分析方法分析文章標(biāo)題、關(guān)鍵詞和摘要中的詞頻,提取領(lǐng)域?qū)I(yè)術(shù)語。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所;中國科學(xué)院自動化研究所(洛陽)機(jī)器人與智能裝備創(chuàng)新研究院,未經(jīng)中國科學(xué)院自動化研究所;中國科學(xué)院自動化研究所(洛陽)機(jī)器人與智能裝備創(chuàng)新研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711475066.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 運(yùn)動行業(yè)卡
- 支持行業(yè)應(yīng)用空中下載的方法、系統(tǒng)及裝置
- 行業(yè)特征詞確定方法和裝置及行業(yè)文本聚類方法和服務(wù)器
- 機(jī)箱(行業(yè)版)
- 鐵路行業(yè)服
- 酒精行業(yè)及淀粉行業(yè)乏汽余熱回收裝置
- 文本分類方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 基于行業(yè)畫像的行業(yè)利潤預(yù)測方法、系統(tǒng)、介質(zhì)及終端
- 一種行業(yè)主體審核方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種選擇目標(biāo)行業(yè)方法及系統(tǒng)





