[發(fā)明專利]網(wǎng)購評論的分析處理方法有效
| 申請?zhí)枺?/td> | 201310198515.2 | 申請日: | 2013-05-24 |
| 公開(公告)號: | CN103279460B | 公開(公告)日: | 2017-02-08 |
| 發(fā)明(設(shè)計)人: | 許大倫;毛穎;張立群 | 申請(專利權(quán))人: | 北京尚友通達信息技術(shù)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司11315 | 代理人: | 許志勇 |
| 地址: | 100085 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評論 分析 處理 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體地說,是涉及一種網(wǎng)購評論的分析處理方法。
背景技術(shù)
隨著信息技術(shù)的進一步發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為當今社會人們獲取信息的重要渠道。互聯(lián)網(wǎng)快捷、方便的特性,以及強大的交互能力,為人們交流思想、闡明觀點、發(fā)表意見提供了新的平臺。
由于受到互聯(lián)網(wǎng)迅猛發(fā)展的影響,一個嶄新的領(lǐng)域應(yīng)運而生----電子商務(wù)。電子商務(wù)是在全球各地廣泛的商業(yè)貿(mào)易活動中,在互聯(lián)網(wǎng)開放的網(wǎng)絡(luò)環(huán)境下,基于瀏覽器或服務(wù)器應(yīng)用方式,買賣雙方不謀面地進行各種商貿(mào)活動,實現(xiàn)消費者的網(wǎng)上購物、商戶之間的網(wǎng)上交易和在線電子支付以及各種商務(wù)活動、交易活動、金融活動和相關(guān)的綜合服務(wù)活動的一種新型的商業(yè)運營模式。
正因為電子商務(wù)是不謀面的商貿(mào)活動,所交易的商品并不能直觀地展現(xiàn)在購買者面前,只能以文字描述或圖片的形式展現(xiàn),所以當人們通過網(wǎng)絡(luò)購物后,會對所購買的商品做出評價,從而反映出商品的質(zhì)量好壞、商品特征或?qū)嵱眯缘刃畔ⅲ@樣的評價對其他的購買者有著重要的參考作用。
在現(xiàn)有技術(shù)中,為了方便購物者獲得商品的客觀的評價信息,往往采用特定的評論分析方法,但是,當前的評論分析方法只是僅僅針對評論的自然語言本身進行處理。舉例來說,某些商品的評論并不能突出地反應(yīng)該商品的特性信息,如“暫時還沒有發(fā)現(xiàn)任何缺點”,這樣的評論不能明顯的看出商品的好壞、實用性等信息,所以,單從評論的自然語言本身進行分析處理,并不能篩選出對用戶最有參考價值的商品評論觀點。
因此,如何篩選出對用戶最有參考價值的商品評論觀點,便成為亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種網(wǎng)購評論的分析處理方法,以解決現(xiàn)有技術(shù)中評論分析方法對評論的自然語言本身進行分析處理,無法達到篩選出對用戶最有參考價值的商品評論觀點。
為解決上述技術(shù)問題,本發(fā)明提供了一種網(wǎng)購評論的分析處理方法,其特征在于,包括:
從某商品的網(wǎng)購評論中提取出的觀點詞和特征詞,將所述觀點詞和特征詞組成特征觀點對;
根據(jù)提取出的所述觀點詞確定所述觀點詞的情感傾向;
根據(jù)所述情感傾向和所述特征觀點對,計算出每個特征在該商品上的情感分布函數(shù)v,以及每個特征在該商品所屬小類上的情感分布函數(shù)vC;
根據(jù)v和vC的偏差得到該商品上不同特征詞的分數(shù),將分數(shù)值最高和/或最低的多個特征詞作為該商品的優(yōu)缺點評論。
優(yōu)選地,其中,所述從某商品的網(wǎng)購評論中提取出的觀點詞和特征詞,進一步為:對某商品的網(wǎng)購評論中以形容詞為主出現(xiàn)的詞匯的比例和頻率進行統(tǒng)計,將統(tǒng)計值最高的一個或多個詞匯作為觀點詞,以及通過設(shè)置的條件從某商品的網(wǎng)購評論中選取出以名詞為主的詞匯進行統(tǒng)計,將統(tǒng)計值最高的一個或多個詞匯作為特征詞。
優(yōu)選地,其中,所述通過設(shè)置的條件從某商品的網(wǎng)購評論中選取出以名詞為主的詞匯進行統(tǒng)計,將統(tǒng)計值最高的一個或多個詞匯作為特征詞,進一步為:從某商品的網(wǎng)購評論中的選取出名詞或詞組為主的詞匯,計算每個詞匯在該商品所在小類的支持度值,以及該小類所屬大類的支持度值;通過設(shè)置的條件將符合條件的名詞或詞組為主的詞匯作為特征詞。
優(yōu)選地,其中,所述通過設(shè)置的條件將符合條件的名詞或詞組為主的詞匯作為特征詞,進一步包括:通過設(shè)置的最低小類的支持度的閾值、最低大類的支持度的閾值、以及停用詞表,判斷選取出的名詞或詞組為主的詞匯在該商品所在小類的支持度值是否大于最低小類的支持度的閾值,或者,判斷選取出的名詞或詞組為主的詞匯在該商品所在小類所屬大類的支持度值是否大于最低大類的支持度的閾值,當上述條件之一滿足時,判斷該名詞或詞組為主的詞匯是否出現(xiàn)在所述停用詞表中,如沒有出現(xiàn),則將該名詞或詞組為主的詞匯作為特征詞。
優(yōu)選地,其中,所述根據(jù)提取出的所述觀點詞確定所述觀點詞的情感傾向,進一步為:根據(jù)設(shè)置所述觀點詞的情感傾向向量,對提取出的所述觀點詞確定其情感傾向值,如該觀點詞的情感傾向值高于設(shè)置的判斷方向值,且通過否定詞表中的否定詞并沒有出現(xiàn)在該觀點詞前/后時,則該觀點詞的情感傾向為正向;
如低于設(shè)置的的判斷方向值,或通過否定詞表中的否定詞判斷出在該觀點詞前/后出現(xiàn)時,則該觀點詞的情感傾向為負向。
優(yōu)選地,其中,所述根據(jù)v和vC的偏差得到該商品上不同特征詞的分數(shù),進一步為:根據(jù)v和vC的偏差通過1-cos(v,vC)的方式得到該商品上不同特征詞的分數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京尚友通達信息技術(shù)有限公司,未經(jīng)北京尚友通達信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310198515.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





