[發明專利]一種多類自然語言隱寫分析方法在審
| 申請號: | 202210264113.7 | 申請日: | 2022-03-17 |
| 公開(公告)號: | CN114462382A | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 向凌云;劉宇航;游卉擎;章登勇 | 申請(專利權)人: | 長沙理工大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/04;G06N3/08 |
| 代理公司: | 北京迎碩知識產權代理事務所(普通合伙) 11512 | 代理人: | 錢揚保;張群峰 |
| 地址: | 410114 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 分析 方法 | ||
1.一種多類自然語言隱寫分析方法,其特征在于包括以下步驟:步驟1.將隱寫分析任務數據集表示為詞向量矩陣;步驟2.文本的深度多任務隱寫分析特征表示獲取;步驟3.多任務隱寫分析模型的訓練;步驟4.使用多任務隱寫分析模型對測試集文本進行隱寫分析;其中,步驟1包括:1.1定義多個隱寫分析任務,分別為:(1)生成式隱寫文本與正常文本隱寫分析任務;(2)生成式隱寫文本與自然文本隱寫分析任務;(3)嵌入式隱寫文本與正常文本隱寫分析任務;(4)嵌入式隱寫文本與自然文本隱寫分析任務;(5)正常文本和自然文本分類任務;1.2將每個隱寫分析任務的數據集中的文本通過詞向量矩陣進行表示。
2.根據權利要求1所述的多類自然語言隱寫分析方法,其特征在于步驟1.2包括:獲取每個隱寫分析任務數據集,將數據集分為訓練集和測試集,數據集包括大量已經進行了分類的文本,所述文本為句子;對數據集中的文本進行分詞和預處理,得到數據集的文本的詞向量矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙理工大學,未經長沙理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210264113.7/1.html,轉載請聲明來源鉆瓜專利網。





