日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種面向中文Web評論的文本情感分類方法無效

專利信息
申請號: 201310050250.1 申請日: 2013-02-08
公開(公告)號: CN103116637A 公開(公告)日: 2013-05-22
發明(設計)人: 李千目;倪銘;印杰;侯君 申請(專利權)人: 無錫南理工科技發展有限公司;江蘇警官學院
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 暫無信息 代理人: 暫無信息
地址: 214192 江蘇省無錫市錫*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 面向 中文 web 評論 文本 情感 分類 方法
【說明書】:

?

技術領域

發明屬于數據處理技術領域,具體地涉及一種面向中文Web評論的文本情感分類方法。

背景技術

文本作為一種重要的信息交互媒介,主要的功能是傳情達意,基于內容的研究已經很成熟,近些年來越來越多的研究開始集中到“傳情”上即情感分析,主要的研究內容包括詞語的語義傾向識別、基于情感的文本分類、觀點提取、主觀性分析等。對一篇文檔而言,能對其語義傾向起到決定性作用的主要是構成這篇文檔所用的詞語。所以,對文本進行基于情感的文本分類的基礎是判定詞的語義傾向。但是目前,不論是英語還是漢語,都沒有一個完整的涵蓋詞語語義傾向的詞典,也不可能有這樣的一個完備的詞典,因為很多的詞語在不同語境中它的語義傾向也不盡相同。Hatzivassiloglou等根據詞語之間關系來判定其語義傾向,他們注意到形容詞的語義傾向受連接它們的連接詞“and”、“but”等約束,知道其中一個詞的語義傾向,就可以推測出另一個。如“excellent?and?X”,可以推測X也是褒義的。根據語言學上連接詞對語義傾向約束性的分析,他們提出了一種四步法的有監督學習算法來判斷一個形容詞的語義傾向。Turney在其論文中介紹了兩種利用詞語與具有明顯語義傾向的種子詞語之間統計關系來自動識別詞語語義傾向的方法:?PMI2IR和LSA。Esuli?通過對一個詞語的注釋(從詞典中獲得)進行訓練和分類,從而判斷其他詞語的語義傾向。

基于情感的文本分類研究大多是通過統計正面或負面語義傾向的詞語特征數目來對文本進行分類。如Turney就使用一無指導學習方法,利用前面提到的PMI2IR方法計算出文本中出現的符合規則的短語的語義傾向,通過對文檔中所有短語的語義傾向的平均值的正負來判斷文檔描述的對象是否值得推薦。PangBo最早利用機器學習方法來解決基于情感的文本分類問題,應用樸素貝葉斯、最大熵、SVM對電影評論進行分類。SVM在幾種分類方法中效果最好,分類準確率最高達到約80%。

事實上,對一篇文章而言,它表達的情感的正面或負面是通過主觀語句體現出來的,如“產品質量好!”。但是像“它的售價剛好是50元!”這樣的客觀語句,雖然有“好”這一特征詞,但并不應該能起到任何作用。但是如果能區分一篇文章中的主觀語句和客觀語句,只對主觀語句進行特征選擇,會對分類的準確率有很大提高。Bruce、Wiebe等利用貝葉斯分類器對句子的主客觀性進行分類。PangBo把主客觀語句分類轉換成求圖的最小截問題,實現一個Cut2based分類器,對主客觀語句進行分類。

近年,基于情感的文本分類逐漸被應用到更多的領域中。例如,微軟公司開發的商業智能系統Pulse,它能夠從大量的評論文本數據中,利用文本聚類技術提取出用戶對產品細節的看法;產品信息反饋系統OpinionObserver,利用網絡上豐富的顧客評論資源,對評論的主觀內容進行分析處理,提取產品各個特征及消費者對其的評價,并給出一個可視化結果;Sanjiv從網絡上的股評信息中獲取某只股票的市場評價,對股票的價格進行預測。

中文的基于情感的文本分類研究還不是很多。基于HowNet,朱嫣嵐在其論文中提出了兩種詞語語義傾向性計算的方法:基于語義相似度的方法和基于語義相關場的方法。Yuen通過計算詞語和具有強烈感情色彩的語素或單個漢字之間在LI2VAC文集上的統計關系來判定詞語語義傾向。T’sou利用詞語的語義傾向來計算新聞文本的語義傾向,衡量公眾對名人的評價。

發明內容

1、本發明的目的。

本發明的目的在于提出一種面向中文Web評論的文本情感分類方法,有效地應用于中文評論文本的情感分析。

2、本發明所采用的技術方案

1.一種面向中文Web評論的文本情感分類方法,整個過程可分為兩個部分:訓練過程和分類過程;

訓練過程按照以下步驟進行:

步驟一、訓練文本預處理;

步驟二、特征選擇:用頻數等統計量來計算文本中的詞條在類別中的分布情況,經過特征選擇,得到該類別的局部特征,所有類別的局部特征詞集合的并集構成訓練集的全局特征詞集合;

步驟三、文本的向量化表示:將每個類別映射到全局特征詞集合上,進行向量化表示,便可得到類別的特征向量,特征向量包括權重和特征詞個數;

步驟四、訓練分類器。

分類過程按照以下步驟進行:

測試文本預處理→特征選擇→分類器分類→輸出分類結果,具體處理如下:

步驟一、測試文本預處理將測試文本化成全局特征詞集合上的特征向量;

步驟二、特征選擇;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫南理工科技發展有限公司;江蘇警官學院,未經無錫南理工科技發展有限公司;江蘇警官學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310050250.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产欧美一区二区精品性色超碰| 麻豆视频免费播放| 天堂av一区二区| 精品少妇的一区二区三区四区| 久久一区二区三区欧美| 国产极品一区二区三区| 亚洲欧洲日韩av| 91免费视频国产| 欧美髙清性xxxxhdvid| 亚洲精品丝袜| 亚洲精品一品区二品区三品区| 国产一区二区伦理| 国产理论一区| 国产精品国产三级国产专区55| 亚洲国产精品二区| 亚洲国产午夜片| 亚洲国产精品一区在线| 亚洲国产精品综合| 右手影院av| 91婷婷精品国产综合久久| 午夜毛片在线| 日本一区二区三区免费视频| 国产精品不卡一区二区三区| 国产无遮挡又黄又爽免费网站| 日本精品三区| 91一区二区三区在线| 99久久免费精品国产免费高清| 特高潮videossexhd| 亚洲国产日韩综合久久精品 | 99精品免费在线视频| 日本护士hd高潮护士| 国产女人和拘做受视频免费| 欧美高清视频一区二区三区| 少妇在线看www| 亚洲精品日韩色噜噜久久五月| 欧美一区二区三区国产精品| 国产一区二三| 欧美一区二区三区久久久久久桃花 | 久久一区二区三区视频| 香港三日本8a三级少妇三级99| 黄色香港三级三级三级| 91麻豆精品国产91久久久资源速度 | 91精品www| 国产日韩一区在线| 神马久久av| 国产精品麻豆一区二区| 91久久一区二区| 91久久国产露脸精品| 色噜噜狠狠一区二区| 在线精品视频一区| 欧美在线精品一区| 日韩中文字幕亚洲欧美| 93久久精品日日躁夜夜躁欧美| 午夜理伦影院| 一级午夜电影| 国产精品爽到爆呻吟高潮不挺| 国产午夜精品免费一区二区三区视频| 国产日韩一区二区在线| 精品国产一区二区三区久久久久久| 视频一区二区中文字幕| 精品三级一区二区| 久久久久久久国产精品视频| 毛片大全免费观看| 男女视频一区二区三区| 国产精品v亚洲精品v日韩精品| 在线视频国产一区二区| 26uuu亚洲国产精品| 一区二区三区精品国产| 日本一区午夜艳熟免费| 国产片91| 国产女人和拘做受在线视频| 秋霞av电影网| 亚洲国产日韩综合久久精品| 午夜黄色网址| 精品国产品香蕉在线| 中文字幕制服丝袜一区二区三区| 色婷婷久久一区二区三区麻豆 | 亚洲国产精品美女| 久久一区二区三区视频| 91一区二区三区在线| 亚洲制服丝袜中文字幕| 亚洲精品一区在线|