[發(fā)明專利]輿情監(jiān)測分析方法在審
| 申請?zhí)枺?/td> | 201611176739.3 | 申請日: | 2016-12-19 |
| 公開(公告)號: | CN106649270A | 公開(公告)日: | 2017-05-10 |
| 發(fā)明(設(shè)計)人: | 唐軍;趙冬;王雪萍;伍媛媛 | 申請(專利權(quán))人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G06Q30/02 |
| 代理公司: | 成都虹橋?qū)@聞?wù)所(普通合伙)51124 | 代理人: | 李凌峰 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輿情 監(jiān)測 分析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù),特別涉及互聯(lián)網(wǎng)大數(shù)據(jù)分析技術(shù)。
背景技術(shù)
在大數(shù)據(jù)時代,以往日常生活里那些無法共享、不可計量的信息都被數(shù)據(jù)化,人們可以通過互聯(lián)網(wǎng)獲取信息,參與討論和表達(dá)意見,一方面,對于企業(yè)的品牌產(chǎn)品等相關(guān)信息的意見也紛紛通過互聯(lián)網(wǎng)信息進(jìn)行表達(dá)和傳遞,形成網(wǎng)絡(luò)輿論;另一方面,對于日常生活中接觸到的產(chǎn)品,人們也傾向于通過互聯(lián)網(wǎng)來進(jìn)行產(chǎn)品信息的查詢,包括其他用戶的評論、專業(yè)網(wǎng)站評估及門戶網(wǎng)站的廣告等等,與此同時,用戶也可以發(fā)布對企業(yè)或產(chǎn)品的評估。網(wǎng)絡(luò)信息的快速傳播和擴(kuò)散,可能產(chǎn)生巨大的輿論力量。因此,在身處于大數(shù)據(jù)時代的企業(yè)必須充分利用數(shù)據(jù)的價值,全面挖掘和監(jiān)控互聯(lián)網(wǎng)數(shù)據(jù)信息,以便于對產(chǎn)品進(jìn)行改良、創(chuàng)新、更換以及其他企業(yè)級的決策,維護(hù)品牌形象,擴(kuò)大品牌影響力,最終促進(jìn)企業(yè)的競爭力。
由于來自互聯(lián)網(wǎng)海量數(shù)據(jù)格式的多樣性,傳統(tǒng)人工采集、處理數(shù)據(jù)方式已經(jīng)難以勝任。雖然目前市面上存在很多輿情分析軟件系統(tǒng),但是其都沒有利用輿情信息專門深入細(xì)致的針對產(chǎn)品、生產(chǎn)商的競爭力作出定量評測。生產(chǎn)商、產(chǎn)品乃至產(chǎn)品屬性的口碑、競爭力是隱藏在海量的輿情數(shù)據(jù)中的非常有價值的信息。產(chǎn)品輿情分析的目標(biāo)不單單是對相關(guān)產(chǎn)品的主題、熱點進(jìn)行解析、跟蹤、預(yù)測及預(yù)警,更重要的是深入的解剖出整個行業(yè)市場中每家廠商的每件產(chǎn)品的相對競爭力,并將其量化使得整個行業(yè)的產(chǎn)品的優(yōu)勝劣汰能夠定性定量的得到清晰的展現(xiàn),同時還能標(biāo)定出產(chǎn)品間的優(yōu)劣點。
發(fā)明內(nèi)容
本發(fā)明的目的是要解決目前輿情分析軟件系統(tǒng)都沒有利用輿情信息專門深入細(xì)致的針對產(chǎn)品、生產(chǎn)商的競爭力作出定量評測的問題,提供了一種輿情監(jiān)測分析方法。
本發(fā)明解決其技術(shù)問題,采用的技術(shù)方案是,輿情監(jiān)測分析方法,其特征在于,包括以下步驟:
步驟1、通過分布式網(wǎng)絡(luò)爬蟲技術(shù)實時抓取各電商網(wǎng)站商品及評論信息,利用模板提取其中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲;
步驟2、針對所存儲的結(jié)構(gòu)化數(shù)據(jù),自動對其進(jìn)行分類、聚類、生成摘要及名稱識別,并進(jìn)行正負(fù)性質(zhì)預(yù)判;
步驟3、輸出并根據(jù)需求呈現(xiàn)結(jié)構(gòu)化數(shù)據(jù)。
具體的,步驟2中,所述正負(fù)性質(zhì)預(yù)判是指對評論信息進(jìn)行文本情感分析。
進(jìn)一步的,所述對評論信息進(jìn)行文本情感分析的方法為:
步驟201、針對不同的商品類型建立不同的文本情感分析模型;
步驟202、判斷該評論信息所屬商品的類型,選擇該商品類型對應(yīng)的文本情感分析模型進(jìn)行分析。
具體的,步驟201中,所述針對不同的商品類型建立不同的文本情感分析模型中,其文本情感分析模型的建立方法為:獲取已有的多個針對某一商品類型的評論信息作為訓(xùn)練集,在訓(xùn)練集的評論信息中進(jìn)行中文分詞操作,得到多個候選詞,獲取每個候選詞對應(yīng)的情感傾向,將候選詞作為特征建立文本情感分析模型。
再進(jìn)一步的,所述獲取每個候選詞對應(yīng)的情感傾向的方式為:判斷候選詞與一般情感基準(zhǔn)詞詞典中各情感基準(zhǔn)詞之間的語義距離,確定候選詞的情感傾向。
具體的,所述獲取每個候選詞對應(yīng)的情感傾向的方式為:人工建立標(biāo)記情感語料庫,將候選詞與人工建立的標(biāo)記情感語料庫進(jìn)行匹配,確定候選詞的情感傾向。
再進(jìn)一步的,步驟202中,在分析時,還提取各評論信息中的候選詞并進(jìn)行統(tǒng)計排序,刪除文本情感分析模型中低效和/或無效的特征。
具體的,步驟2中,還對所存儲的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行清洗,所述清洗為對離群數(shù)據(jù)及明顯不合理的數(shù)據(jù)進(jìn)行剔除。
本發(fā)明的有益效果是,在本發(fā)明方案中,通過上述輿情監(jiān)測分析方法,可對評論信息自動進(jìn)行分析,從而得出針對產(chǎn)品或生產(chǎn)商的競爭力所作出的定量評測,為生產(chǎn)商或商品開發(fā)人員提供參考,提升產(chǎn)品研發(fā)效率和針對性。
具體實施方式
下面結(jié)合實施例,詳細(xì)描述本發(fā)明的技術(shù)方案。
本發(fā)明所述輿情監(jiān)測分析方法為:首先通過分布式網(wǎng)絡(luò)爬蟲技術(shù)實時抓取各電商網(wǎng)站商品及評論信息,利用模板提取其中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲;然后針對所存儲的結(jié)構(gòu)化數(shù)據(jù),自動對其進(jìn)行分類、聚類、生成摘要及名稱識別,并進(jìn)行正負(fù)性質(zhì)預(yù)判;最后輸出并根據(jù)需求呈現(xiàn)結(jié)構(gòu)化數(shù)據(jù)。
實施例
本發(fā)明實施例的輿情監(jiān)測分析方法,其包括以下步驟:
步驟1、通過分布式網(wǎng)絡(luò)爬蟲技術(shù)實時抓取各電商網(wǎng)站商品及評論信息,利用模板提取其中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲。
本步驟中,分布式網(wǎng)絡(luò)爬蟲技術(shù)為現(xiàn)有較為通用的一種信息獲取技術(shù),此處不再詳述。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川長虹電器股份有限公司,未經(jīng)四川長虹電器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611176739.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:汽車座椅(后排)
- 下一篇:兒童安全座椅(CC01)
- 一種輿情信息獲取方法及裝置
- 一種輿情歸并方法、裝置、服務(wù)器和存儲介質(zhì)
- 企業(yè)輿情監(jiān)測方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 一種輿情數(shù)據(jù)推送方法、裝置、存儲介質(zhì)和終端設(shè)備
- 一種輿情分析方法
- 輿情分析方法、裝置、終端設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 知識庫構(gòu)建方法及裝置
- 生成輿情專題方法、系統(tǒng)及存儲介質(zhì)
- 基于區(qū)塊鏈、輿情和核心算法的金融風(fēng)控系統(tǒng)
- 網(wǎng)絡(luò)輿情云平臺用戶單位變更配置的方法及系統(tǒng)
- 一種用于監(jiān)測站的天氣監(jiān)測系統(tǒng)
- 一種電力設(shè)備安全監(jiān)測系統(tǒng)及監(jiān)測方法
- 基于區(qū)塊鏈的環(huán)境監(jiān)測及數(shù)據(jù)處理方法和裝置
- 監(jiān)測方法以及裝置
- 醫(yī)院后勤能耗目標(biāo)對象的監(jiān)測方法、裝置、計算機(jī)設(shè)備
- 故障監(jiān)測裝置和故障監(jiān)測系統(tǒng)
- 一種社區(qū)養(yǎng)老安全監(jiān)測系統(tǒng)
- 一種濕地生態(tài)環(huán)境監(jiān)測系統(tǒng)及方法
- 一種接地網(wǎng)阻抗短路在線監(jiān)測裝置
- 一種廢氣監(jiān)測裝置





