[發明專利]一種微博情感確定方法在審
| 申請號: | 201810372663.4 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108647257A | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 寧煥生;吳京京 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 微博 句式類型 情感傾向 文本 情感詞典 影響權 分句 構建 分類規則集 情感分析 預先設置 | ||
1.一種微博情感確定方法,其特征在于,包括:
構建微博情感詞典;
獲取待處理微博文本;
按照預先設置的句式分類規則集,確定獲取的所述待處理微博文本中各分句的句式類型及所述句式類型對情感傾向影響權值;
根據構建的微博情感詞典,以及確定的待處理微博文本中各分句的句式類型及所述句式類型對情感傾向影響權值,確定所述待處理微博文本的情感傾向值。
2.根據權利要求1所述的微博情感確定方法,其特征在于,所述構建微博情感詞典包括:
提取微博詞匯、微博表情符號,根據提取的微博詞匯、微博表情符號對基礎情感詞典進行擴展,得到微博情感詞典;
其中,所述微博情感詞典包括:微博基礎情感詞典、網絡情感詞典、微博表情符號詞典、修飾詞典。
3.根據權利要求2所述的微博情感確定方法,其特征在于,所述修飾詞典包括:否定詞詞典和程度副詞詞典。
4.根據權利要求1所述的微博情感確定方法,其特征在于,在獲取待處理微博文本之后,所述方法還包括:
對獲取的所述待處理微博文本進行預處理并進行情感標注;
其中,所述預處理包括:降噪、分詞和停用詞過濾操作,并在分詞過程中添加用戶自定義詞典。
5.根據權利要求1所述的微博情感確定方法,其特征在于,在按照預先設置的句式分類規則集,確定獲取的所述待處理微博文本中各分句的句式類型及所述句式類型對情感傾向影響權值之前,所述方法還包括:
構造分句算法,對獲取的所述待處理微博文本進行分句,其中,所述分句算法是針對微博文本表述不規范性進行設置的。
6.根據權利要求1所述的微博情感確定方法,其特征在于,所述句式類型包括:簡單句和復雜句;
其中,所述簡單句包括:感嘆句、疑問句、肯定句,所述復雜句包括:反問句、轉折句、假設句、選擇句、遞進句、讓步句、總結句。
7.根據權利要求1所述的微博情感確定方法,其特征在于,所述待處理微博文本的情感傾向值E(p)=E(s1)+E(s2)+…+E(sn);
其中,E(p)表示待處理微博文本p的情感傾向值,E(si)表示待處理微博文本p中第i個分句si的情感傾向值;E(si)=Wseni·Epri(si),Wseni為第i個分句si的句式類型對情感傾向的影響權值,Wseni由句式分類規則確定,Epri(si)為第i個分句si的基本情感值。
8.根據權利要求7所述的微博情感確定方法,其特征在于,所述基本情感值Epri(si)表示為:
其中,Wdeg為程度副詞權值,Wno為否定詞權值,E(wt)表示第i個分句si中第t個情感詞的情感值,E(emjj)表示第i個分句si中第j個表情符號的情感值,n表示情感詞的數目,m表示表情符號的數目。
9.根據權利要求4所述的微博情感確定方法,其特征在于,在根據構建的微博情感詞典,以及確定的待處理微博文本中各分句的句式類型及所述句式類型對情感傾向影響權值,確定所述待處理微博文本的情感傾向值之后,所述方法還包括:
將輸出的所述待處理微博文本的情感傾向值與預先標注的情感傾向值進行對比驗證。
10.根據權利要求1所述的微博情感確定方法,其特征在于,在根據構建的微博情感詞典,以及確定的待處理微博文本中各分句的句式類型及所述句式類型對情感傾向影響權值,確定所述待處理微博文本的情感傾向值之后,所述方法還包括:
構建用戶交互界面。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810372663.4/1.html,轉載請聲明來源鉆瓜專利網。





