[發明專利]基于度量情感學習的標簽表示方法、終端設備及存儲介質有效
| 申請號: | 202111000573.0 | 申請日: | 2021-08-30 |
| 公開(公告)號: | CN113449521B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 蔡飛;宋城宇;王祎童;劉登峰;王思遠;張維明;張鑫;陳洪輝 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/237;G06F40/247;G06N3/08 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 曾志鵬 |
| 地址: | 410003 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 度量 情感 學習 標簽 表示 方法 終端設備 存儲 介質 | ||
1.一種基于度量情感學習的標簽表示方法,其特征是,包括:
獲取包括多個三元組的標簽集,所述三元組包括第一詞匯,所述第一詞匯的反義詞和所述第一詞匯的近義詞;
將所述標簽集中的三元組輸入至利用全連接神經網路訓練好的轉換矩陣中,得到向量空間中的三元組;
根據似然比函數和所述向量空間中的三元組,確定待表示文本中每一個標簽的標簽詞,具體為:
根據似然比函數和所述向量空間中的三元組,確定待表示文本中第一個標簽和最后一個標簽的標簽詞;
根據第一個標簽的標簽詞和最后一個標簽的標簽詞的差值,確定情感梯度;
根據所述情感梯度確定待表示文本中其余標簽的標簽詞。
2.如權利要求1所述的方法,其特征是,將所述標簽集中的三元組輸入至利用全連接神經網路訓練好的轉換矩陣中,得到向量空間中的三元組,具體為:
所述轉換矩陣根據第一公式確定,所述第一公式為:
式中,和分別是全連接神經網絡中多層感知層的權重矩陣和偏置,為所述全連接神經網絡的激活函數,,其中為所述第一詞匯,為所述第一詞匯的近義詞,為所述第一詞匯的反義詞;
利用所述第一公式將所述標簽集中的三元組轉換為向量空間中的三元組。
3.如權利要求2所述的方法,其特征是,所述全連接神經網絡的約束函數根據第二公式確定,所述第二公式為:
式中,為兩個向量之間的負余弦相似度。
4.如權利要求3所述的方法,其特征是,所述全連接神經網絡的損失函數根據第三公式確定,所述第三公式為:
式中,為設定閾值,且,為所述標簽集。
5.如權利要求1所述的方法,其特征是,所述根據似然比函數和所述向量空間中的三元組,確定待表示文本中第一個標簽和最后一個標簽的標簽詞,具體為:
根據第四公式確定待表示文本中第一個標簽的標簽詞,所述第四公式為:
式中,為數據集和第個標簽的標簽詞之間的交叉熵,所述,中標簽為的為正樣本,其余為負樣本,為第個標簽對應的文本,為預設文本模式中的第個模式,是給定產生標簽的可能性,根據第五公式確定,所述第五公式為:
;
根據第六公式確定,所述第六公式為:
式中,是中的樣本數;
確定所述第一個標簽的標簽詞后,從所述向量空間的三元組中確定所述第一個標簽的標簽詞對應的反義詞作為候選詞,將所述候選詞輸入至所述第四公式至所述第六公式,確定待表示文本的最后一個標簽的標簽詞。
6.如權利要求5所述的方法,其特征是,根據第一個標簽的標簽詞和最后一個標簽的標簽詞的差值,確定情感梯度,具體為:
根據第七公式確定情感轉移矢量,所述第七公式為:
式中,和分別為第一個標簽的標簽詞和最后一個標簽的標簽詞,為所述情感轉移矢量;
根據所述情感轉移矢量確定情感梯度,具體為:
根據第八公式確定所述情感梯度,所述第八公式為:
式中,為所述標簽的數量。
7.如權利要求6所述的方法,其特征是,根據所述情感梯度確定待表示文本中其余標簽的標簽詞,具體為:
根據第九公式確定待表示文本中其余標簽的標簽詞,所述第九公式為:
式中,,為詞匯集,。
8.一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征是,所述處理器執行所述計算機程序時實現如權利要求1至7任一項所述方法的步驟。
9.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征是,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111000573.0/1.html,轉載請聲明來源鉆瓜專利網。





