[發明專利]一種基于語義要素的低資源文本識別算法在審
| 申請號: | 202011001618.1 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112131887A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 付勇;井友鼎;杜創勝;王旭峰;甘志芳;王順智 | 申請(專利權)人: | 河南合眾偉奇云智科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06N3/04;G06F16/35 |
| 代理公司: | 鄭州知己知識產權代理有限公司 41132 | 代理人: | 季發軍 |
| 地址: | 450000 河南省鄭州市鄭東新區*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 要素 資源 文本 識別 算法 | ||
1.一種基于語義要素的低資源文本識別算法,其特征在于:所述算法包括:
S1、獲取文本句子,對文本句子進行編碼處理,得到編碼后的句子張量表示;
S2、對步驟S1中得到的句子張量表示進行語義要素識別處理,得到語義要素識別結果;
S3、用步驟S2中得到的語義要素識別結果對步驟S1中得到的句子張量表示進行縮放處理;
S4、利用均值池化的方法對步驟S3中經縮放的句子張量表示進行處理,得到語義要素向量表示;
S5、利用均值池化的方法對步驟S1中得到的句子張量表示進行處理,得到句子向量表示;
S6、將步驟S5中得到的句子向量表示與步驟S4中得到的語義要素向量表示進行拼接處理,得到句子最終表示;
S7、對步驟S6中得到的句子最終表示進行處理,得到最終的文本類型概率。
2.根據權利要求1所述的一種基于語義要素的低資源文本識別算法,其特征在于:所述步驟S1中使用LSTM或者Transformer對文本句子進行編碼處理。
3.根據權利要求1所述的一種基于語義要素的低資源文本識別算法,其特征在于:所述步驟S2中語義要素識別處理方法中包括sigmoid函數。
4.根據權利要求1所述的一種基于語義要素的低資源文本識別算法,其特征在于:所述步驟S3中縮放處理方法為元素級別的相乘。
5.根據權利要求1所述的一種基于語義要素的低資源文本識別算法,其特征在于:所述步驟S7中對句子最終表示的處理方法中包括softmax函數或sigmoid函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南合眾偉奇云智科技有限公司,未經河南合眾偉奇云智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011001618.1/1.html,轉載請聲明來源鉆瓜專利網。





