[發(fā)明專利]評價處理方法、裝置和計算機系統(tǒng)及介質(zhì)在審
| 申請?zhí)枺?/td> | 201811202297.4 | 申請日: | 2018-10-16 |
| 公開(公告)號: | CN111144122A | 公開(公告)日: | 2020-05-12 |
| 發(fā)明(設(shè)計)人: | 武兆杰 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/951 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 呂雁葭 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評價 處理 方法 裝置 計算機系統(tǒng) 介質(zhì) | ||
本公開提供了一種評論處理方法,包括:對接收的評論進行預(yù)處理,得到屬性詞;基于所述屬性詞與相鄰的形容詞之間的距離確定評價詞,得到評價單元,所述評價單元至少包括一組屬性詞和評價詞;以及至少基于所述評價單元的評價詞獲取所述評論的情感傾向。本公開另一方面還提供了一種評論處理裝置、一種計算機系統(tǒng)和一種計算機可讀存儲介質(zhì)。
技術(shù)領(lǐng)域
本公開涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,更具體地,涉及一種評價處理方法、裝置和計算機系統(tǒng)及介質(zhì)。
背景技術(shù)
互聯(lián)網(wǎng)早已成為人們生活中的一部分,幾乎所有的互聯(lián)網(wǎng)形式都提供用戶評論功能。真實且有價值的用戶評論可以在很大程度上幫助其它用戶了解被評價對象。這里的被評價對象可以是某個物品,也可以是某個服務(wù)項目。
在實現(xiàn)本公開構(gòu)思的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:并不是所有用戶都能從評論中收益,經(jīng)分析是由于互聯(lián)網(wǎng)用戶群體很大,發(fā)表的評論的數(shù)量、評論的字數(shù)往往很多,而用戶已經(jīng)習(xí)慣于碎片化閱讀,用戶很難在時間允許范圍內(nèi)發(fā)現(xiàn)并理解評論中要表達的核心觀點。因此,需要通過具體方法將評論中的核心重要觀點挖掘出來,以便讓有價值的信息能夠更有效地呈現(xiàn)給用戶。
發(fā)明內(nèi)容
有鑒于此,本公開提供了一種便于將評論中的核心重要觀點挖掘出來,使得評價中有價值的信息能夠更有效地呈現(xiàn)給用戶的評價處理方法、裝置和計算機系統(tǒng)及介質(zhì)。
本公開的一個方面提供了一種評價處理方法,包括:首先,對接收的評論進行預(yù)處理,得到屬性詞,然后,基于所述屬性詞與相鄰的形容詞之間的距離確定評價詞,得到評價單元,所述評價單元至少包括一組屬性詞和評價詞,接著,至少基于所述評價單元的評價詞獲取所述評論的情感傾向。由于基于所述屬性詞與相鄰的形容詞之間的距離確定評價詞,可以實現(xiàn)對沒有直接與屬性詞相鄰的評價詞的識別,提高評價詞的識別的準(zhǔn)確度,進而提高確定的情感傾向的準(zhǔn)確度,便于用戶直接得到評論的情感傾向。
根據(jù)本公開的實施例,所述對接收的評論進行預(yù)處理,得到屬性詞可以包括如下操作:首先,至少基于第一分詞工具對所述評論進行分詞,得到詞以及對應(yīng)的詞性,其中,所述詞性包括名詞,所述第一分詞工具為基于FudanNLP分詞工具進行源碼級別二次開發(fā)擴展出補充字典功能的分詞工具,該補充字典包括評論中常用術(shù)語,然后,利用詞性為名詞的詞在屬性詞庫中進行匹配得到屬性詞。
根據(jù)本公開的實施例,所述屬性詞庫為屬性詞聚類庫,每一聚類具有一個基準(zhǔn)屬性詞或者一個基準(zhǔn)屬性詞和至少一個相似屬性詞,所述利用詞性為名詞的詞在屬性詞庫中進行匹配得到屬性詞可以包括利用詞性為名詞的詞在所述屬性詞聚類庫中進行匹配得到屬性詞。
根據(jù)本公開的實施例,所述詞性包括名詞、否定副詞和形容詞,對于接收的評論中的一條評論,所述基于所述屬性詞與相鄰的形容詞之間的距離確定評價詞,得到評價單元可以包括如下操作:首先,對所述一條評論的詞進行遍歷,將第一個屬性詞作為待選屬性詞,然后,遍歷所述待選屬性詞之后指定個數(shù)的詞,其中,如果遍歷到形容詞之前先遍歷到另一個屬性詞,將所述另一個屬性詞作為待選屬性詞,如果遍歷到形容詞之前先遍歷到語義邊界,將所述語義邊界之后的第一個屬性詞作為待選屬性詞,重復(fù)遍歷所述待選屬性詞之后指定個數(shù)的詞,直至所述待選屬性詞之后指定個數(shù)的詞中遍歷到形容詞,將所述待選屬性詞作為屬性詞,將所述形容詞作為評價詞,接著,如果所述屬性詞和所述評價詞之間不包括否定副詞,則所述評價單元包括所述屬性詞和所述評價詞,然后,如果所述屬性詞和所述評價詞之間包括否定副詞,則所述評價單元包括所述屬性詞、否定副詞和所述評價詞。
根據(jù)本公開的實施例,所述至少基于所述評價單元的評價詞獲取所述評論的情感傾向可以包括如下操作:首先,將所述評價單元在屬性情感庫中進行匹配,得到所述評價單元的情感傾向,所述感情傾向包括:正面、負面和中性,其中,所述屬性情感庫包括至少一組屬性詞、評價詞和感情傾向標(biāo)識,并且/或者,所述屬性情感庫包括至少一組屬性詞、否定副詞、評價詞和感情傾向標(biāo)識,然后,將所述評價單元的情感傾向作為所述評論的情感傾向。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811202297.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





