[發明專利]一種文本情感測量方法和裝置在審
| 申請號: | 201911283463.2 | 申請日: | 2019-12-13 |
| 公開(公告)號: | CN111078882A | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 何涇沙;侯自強;朱娜斐;李想;楊玥;葛加可;張琨;滕達;李文欣;韓松 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/08;G06N20/00 |
| 代理公司: | 北京匯信合知識產權代理有限公司 11335 | 代理人: | 陳紅 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 測量方法 裝置 | ||
1.一種文本情感測量方法,其特征在于,包括:
對所測量對象的文本文字數據進行收集;
對收集的對象數據進行數據預處理,將所述對象數據轉換為適用于策略模型學習的格式化數據;
對所述格式化數據進行模型訓練、驗證評估,得到策略模型;
根據所需識別對象的文本文字數據,選擇合適的策略模型作為文本情感測量模型;
對所需識別對象的文本文字數據進行預處理后,輸入所述文本情感測量模型中,得出預測結果。
2.如權利要求1所述的文本情感測量方法,其特征在于,所述文本文字數據包括:對象社交平臺文章與評論、對象購物平臺數據和對象上下文信息;
所述對象上下文信息包括:對象位置上下文信息和對象時間上下文信息。
3.如權利要求1所述的文本情感測量方法,其特征在于,所述數據預處理包括:數據清洗、數據集成、數據歸約和數據變化。
4.如權利要求1所述的文本情感測量方法,其特征在于,所述對所述格式化數據進行模型訓練、驗證評估,得到策略模型;包括:
選取多個機器學習模型和/或深度學習模型;
計算各模型在統計數據上的誤差,選擇誤差最小的模型作為策略模型。
5.如權利要求1所述的文本情感測量方法,其特征在于,還包括:
對所述預測結果進行可視化;
通過進行預測的文本文字數據,進一步優化所述策略模型。
6.一種文本情感測量裝置,其特征在于,包括:
數據收集模塊,用于對所測量對象的文本文字數據進行收集;
數據預處理模塊,用于對收集的對象數據進行數據預處理,將所述對象數據轉換為適用于策略模型學習的格式化數據;
模型訓練模塊,用于對所述格式化數據進行模型訓練、驗證評估,得到策略模型;
對象文本情況測量模塊,用于根據所需識別對象的文本文字數據,選擇合適的策略模型作為文本情感測量模型;對所需識別對象的文本文字數據進行預處理后,輸入所述文本情感測量模型中,得出預測結果。
7.如權利要求6所述的文本情感測量裝置,其特征在于,所述文本文字數據包括:對象社交平臺文章與評論、對象購物平臺數據和對象上下文信息;
所述對象上下文信息包括:對象位置上下文信息和對象時間上下文信息。
8.如權利要求6所述的文本情感測量裝置,其特征在于,所述數據預處理包括:數據清洗、數據集成、數據歸約和數據變化。
9.如權利要求6所述的文本情感測量裝置,其特征在于,所述對所述格式化數據進行模型訓練、驗證評估,得到策略模型;包括:
選取多個機器學習模型和/或深度學習模型;
計算各模型在統計數據上的誤差,選擇誤差最小的模型作為策略模型。
10.如權利要求6所述的文本情感測量裝置,其特征在于,還包括:
數據可視化模塊,用于對所述預測結果進行可視化;
模型優化模塊,用于通過進行預測的文本文字數據,進一步優化所述策略模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911283463.2/1.html,轉載請聲明來源鉆瓜專利網。





