[發明專利]酒店情感詞典的建立方法、評論的情感分析方法及系統在審
| 申請號: | 201610149697.8 | 申請日: | 2016-03-16 |
| 公開(公告)號: | CN107203520A | 公開(公告)日: | 2017-09-26 |
| 發明(設計)人: | 李鳴;雷云奔;徐志廣;張宏俊;朱夢堯;吳波 | 申請(專利權)人: | 中國科學院上海高等研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 上海光華專利事務所31219 | 代理人: | 王再朝 |
| 地址: | 201210 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 酒店 情感 詞典 建立 方法 評論 分析 系統 | ||
技術領域
本發明涉及情感分析領域,特別是涉及一種酒店情感詞典的建立方法、評論的情感分析方法及系統。
背景技術
隨著電子商務的快速發展,越來越多的人選擇在網絡上預訂酒店,并對酒店入住體驗進行在線評論。然而,酒店評論信息量龐大冗雜,對于消費者和商家查找有用的信息帶來了極大的困難。如何方便快捷地挖掘出評論中有價值的信息逐漸成為研究熱點。情感分析能從評論中獲取用戶的喜怒哀樂,從而辨識用戶對酒店的喜好程度。
傳統的情感分析主要采用兩類方法,基于情感詞典的方法和基于機器學習的方法。基于篇章、句子級別的粗粒度情感分析只能了解某些評論整體是正面還是負面的。然而,一條評論往往既有正面信息又有負面信息,因此,提取某方面的特征后再分類分析更能準確地得出用戶的喜好,以便了解用戶對酒店各個特性屬性的需求。
發明內容
鑒于以上所述現有技術的缺點,本發明的目的在于提供一種酒店情感詞典的建立方法、評論的情感分析方法及系統,用于解決現有技術中沒有酒店專用情感詞典,以及沒用針對酒店特征分類進行情感分析等問題。
為實現上述目的及其他相關目的,本發明提供一種酒店領域專用情感詞典的建立方法,所述酒店領域專用情感詞典包括:酒店定制情感詞典、網絡術語情感詞典、否定詞詞典、和程度副詞詞典,其中,所述方法包括:建立所述酒店定制情感詞典,包括:抓取消費者對于酒店的網絡評論;從所述網絡評論中提取形容詞、和/或副詞作為候選詞;保留預設基礎情感詞典中未收錄的各所述候選詞;從保留的候選詞中選擇至少一個正面候選詞構成正面基準詞集合、和至少一個負面候選詞構成負面基準詞集合;根據所述正面基準詞集合和所述負面基準詞集合,通過點互信息法確定各所述候選詞的定制正、負面極性后加以存儲。建立所述網絡術語情感詞典,包括:采集所述預設基礎情感詞典中未收錄且用于表示情感的正面網絡流行詞語、和負面網絡流行詞語,并加以存儲。建立所述否定詞詞典,包括:收集各否定詞,并加以存儲。建立所述程度副詞詞典,包括:收集各程度副詞,并加以存儲。
于本發明一實施例中,所述預設基礎情感詞典包括:基礎正面情感詞典、和基礎負面情 感詞典。
于本發明一實施例中,分別設置所述酒店領域專用情感詞典中相關正面詞語的第一強度值;相關負面詞語、及所述否定詞的第二強度值;以及各所述程度副詞的各第三強度值,并加以存儲。
為實現上述目的及其他相關目的,本發明提供一種酒店評論的細粒度情感分析方法,包括:抓取消費者對于酒店的評論數據;從所述評論數據的評論內容中提取關于酒店評價項目的特征詞語,其中,所述特征詞語包括:名詞、或名詞詞組;從所述評論內容中識別出含有所述特征詞語的單句作為觀點句;從所述觀點句中提取形容詞、和/或副詞與所述的酒店領域專用情感詞典的建立方法中建立的酒店領域專用情感詞典中的詞語匹配并返回相應的強度值,據以計算各所述觀點句的情感分;根據各所述觀點句的情感分計算所述評論內容的情感分。
于本發明一實施例中,所述從所述評論數據的評論內容中提取關于酒店評價項目的特征詞語之前,還包括文本預處理方法:將所述評論內容分成各個單句;將所述各個單句分成各個詞語;標記所述各個詞語的詞性;排除停用的詞語。
于本發明一實施例中,還包括:檢測所述各個單句中是否存在重復次數大于預設重復閾值的特征詞語;若是,則分別構建重復的特征詞語的集合作為各候選特征集;通過APRIORI算法從各所述候選特征集中產生各頻繁特征集,并以各所述頻繁特征集中詞語的特征作為各標識詞語;從所述評論內容中識別出含有各所述標識詞語的單句作為各觀點句;從各所述觀點句中提取形容詞、和/或副詞與權利要求3所述的酒店領域專用情感詞典的建立方法中建立的酒店領域專用情感詞典中的詞語匹配并返回相應的強度值,據以計算各所述觀點句的情感分;根據各所述觀點句的情感分計算所述評論內容的情感分。
于本發明一實施例中,還包括:從所述評論數據中獲取消費者的類型;按照各所述類型對各所述評論數據分類;計算得到各所述類型的相應評論內容的情感分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院上海高等研究院,未經中國科學院上海高等研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610149697.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鐵路隧道內雙總線供電系統
- 下一篇:一種電動汽車安全駕駛輔助系統





