[發明專利]一種面向中文評論的情感多傾向分類方法有效
| 申請號: | 202011547122.4 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112883145B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 張少中 | 申請(專利權)人: | 浙江萬里學院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/284 |
| 代理公司: | 寧波甬致專利代理有限公司 33228 | 代理人: | 李迎春 |
| 地址: | 315100 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 中文 評論 情感 傾向 分類 方法 | ||
1.一種面向中文評論的情感多傾向分類方法,其特征在于:包括如下步驟:
S1,提取語素情感變量;根據中文語素詞庫和情感語料詞庫對評論文本中關于被評論對象的各種語素詞和情感詞進行提取,采用皮爾遜相關系數方法計算語素詞與情感詞之間的關聯系數,通過關聯系數組成語素情感變量;
S2,構建語素情感變量之間的相似性關系;采用條件互信息計算公式計算兩個語素情感變量的近似關系,對語素情感變量之間的關系進行描述;
S3,計算語素情感緊密路徑;將語素情感變量看成是有向加權無環圖中的節點,稱為語素情感節點或語素情感節點變量,在語素情感節點之間構建有向加權關系連接,作為有向加權鏈接邊,在這些有向加權鏈接邊基礎上,基于有向加權無環圖模型設計改進的最短路徑搜索算法,搜索滿足一定權值條件的有效路徑,每個路徑都是一種情感傾向性分類;
步驟S3中,語素情感緊密路徑的計算包括如下步驟:
c1,計算有向加權無環圖的有向鏈接邊長度,將相似性權值轉換為有向邊長度,Li,j=-lnWi,j,其中,Li,j為有向邊長度;
c2,計算情感傾向分類路徑,變量初始化,順序執行以下步驟:
c21,從語素情感變量集合V中選取一個沒有父節點的語素情感節點變量作為開始節點,記為vs;
c22,將開始節點的子節點初始化為自身,語素情感變量集合V中其他語素情感節點的子節點初始化為空;
c23,將語素情感節點vi到語素情感節點vj的路徑長度記為Di,j,開始節點到自身路徑長度為0,開始節點到其他語素情感節點的路徑長度初始值為無窮大;語素情感節點vi與語素情感節點vj之間的路徑長度等于兩語素情感節點之間全部有向邊長度的代數和;
c24,初始化分類和候選節點集合,Ck={vs};Q={vs};其中,Ck為第k個情感傾向分類,Q為候選節點集合,vs為開始節點;
c3,當語素情感節點變量集合V不為空,搜索候選節點集合Q中的語素情感節點,找出具有最短路徑長度的語素情感節點,執行如下步驟:
c31,當語素情感節點變量vi和vj都在候選節點集合Q中,并且i≠j時,如果開始節點vs到語素情感節點Vi的路徑長度小于或等于開始節點vs到語素情感節點vj的路徑長度,則從候選節點集合Q中刪除路徑長度最短的語素情感節點vi;
c32,將具有最短路徑長度的語素情感節點vi加入到最短路徑集合中;
c33,對于每個從語素情感節點vi出發連接到語素情感節點vt的有向邊,當開始節點vs到語素情感節點vi的路徑長度加上語素情感節點vi到語素情感節點vt的有向邊長度的代數和小于開始節點vs到語素情感節點vt的路徑長度時,則使用開始節點vs到語素情感節點vi的路徑長度加上語素情感節點vi到語素情感節點vt的有向邊長度的代數和來更新最短路徑長度Ds,t,并將與語素情感節點vi具有最短路徑長度的后繼節點置為語素情感節點vt;如果語素情感節點vt不在候選集合Q中,則將語素情感節點vt加入候選節點集合Q;
c34,當語素情感節點vi沒有后繼節點,則進行搜索下一個分類;
c35,如果語素情感節點vi屬于語素情感節點集合V,則從語素情感節點集合V中刪除已經給出最短路徑的語素情感節點vi;
c4,若路徑長度小于設定的最大路徑長度閾值,則是有效分類,算法結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江萬里學院,未經浙江萬里學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011547122.4/1.html,轉載請聲明來源鉆瓜專利網。





