[發(fā)明專利]一種數(shù)據(jù)分類方法、設備和可讀存儲介質在審
| 申請?zhí)枺?/td> | 202110065077.7 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112766368A | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設計)人: | 張聰;陳聰;張超;嚴自強 | 申請(專利權)人: | 咪咕音樂有限公司;咪咕文化科技有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;曹娜 |
| 地址: | 610000 四川省成都市武侯*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數(shù)據(jù) 分類 方法 設備 可讀 存儲 介質 | ||
1.一種數(shù)據(jù)分類方法,其特征在于,包括以下步驟:
獲取待分類數(shù)據(jù);
提取所述待分類數(shù)據(jù)的線性特征;
將所述線性特征輸入到全指向型自注意力神經(jīng)網(wǎng)絡,得到所述待分類數(shù)據(jù)的特征矩陣;
對所述特征矩陣進行歸一化處理,得到所述待分類數(shù)據(jù)屬于各類別標簽的預測概率;
其中,所述待分類數(shù)據(jù)包括n個子數(shù)據(jù),n為整數(shù),且n大于或等于2;
所述全指向型自注意力神經(jīng)網(wǎng)絡利用所述子數(shù)據(jù)之間的上下文特征、所述子數(shù)據(jù)之間的相關性特征以及每一子數(shù)據(jù)對預測所述待分類數(shù)據(jù)的類別標簽的重要程度,得到所述待分類數(shù)據(jù)的特征矩陣。
2.根據(jù)權利要求1所述的數(shù)據(jù)分類方法,其特征在于,在所述將所述線性特征輸入到全指向型自注意力神經(jīng)網(wǎng)絡之后,還包括:
獲取所述待分類數(shù)據(jù)的特征空間,所述特征空間用于計算所述待分類數(shù)據(jù)與其他數(shù)據(jù)的相似度。
3.根據(jù)權利要求1所述的數(shù)據(jù)分類方法,其特征在于,所述將所述線性特征輸入到全指向型自注意力神經(jīng)網(wǎng)絡,得到所述待分類數(shù)據(jù)的特征矩陣,包括:
利用卷積神經(jīng)網(wǎng)絡CNN將所述線性特征轉換為非線性特征,其中,所述卷積神經(jīng)網(wǎng)絡CNN為未經(jīng)池化的CNN;
利用雙向門控循環(huán)單元Bi-GRU從所述非線性特征中提取所述子數(shù)據(jù)之間的上下文特征;
使用多頭注意力機制Multi-Head Self-Attention機制,根據(jù)所述子數(shù)據(jù)之間的上下文特征,得到所述子數(shù)據(jù)之間的相關性特征;
使用注意力機制Attention機制,根據(jù)所述相關性特征得到每一子數(shù)據(jù)對預測所述待分類數(shù)據(jù)的類別標簽的重要程度;
根據(jù)所述子數(shù)據(jù)之間的上下文特征、所述子數(shù)據(jù)之間的相關性特征以及每一子數(shù)據(jù)對預測所述待分類數(shù)據(jù)的類別標簽的重要程度,得到所述待分類數(shù)據(jù)的特征矩陣。
4.根據(jù)權利要求3所述的數(shù)據(jù)分類方法,其特征在于,所述利用雙向門控循環(huán)單元Bi-GRU從所述非線性特征中提取所述子數(shù)據(jù)之間的上下文特征,包括:
通過如下方式提取所述子數(shù)據(jù)之間的上下文特征:
其中:
O為所述待分類數(shù)據(jù)的非線性特征表示,O={o1,o2,...on};
ot表示第t個子數(shù)據(jù)輸入的非線性特征的向量,t∈[1,n],t為正整數(shù);
表示第(t-1)個子數(shù)據(jù)所述Bi-GRU向前的隱層狀態(tài)的輸出;
表示第(t-1)個子數(shù)據(jù)所述Bi-GRU反向的隱層狀態(tài)的輸出;
表示第t個子數(shù)據(jù)所述Bi-GRU向前的隱層狀態(tài)的輸出;
表示第t個子數(shù)據(jù)所述Bi-GRU反向的隱層狀態(tài)的輸出;
當t=1時,通過預先定義得到;
wt表示第t個子數(shù)據(jù)所述Bi-GRU對應的向前隱層狀態(tài)對應的權重;
vt表示第t個子數(shù)據(jù)所述Bi-GRU對應的反向隱層狀態(tài)對應的權重;
bt表示第t個子數(shù)據(jù)隱層狀態(tài)對應的偏置;
S為所述待分類數(shù)據(jù)的特征編碼,S={s1,s2,...sn};所述待分類數(shù)據(jù)的特征編碼包含子數(shù)據(jù)之間的上下文特征;
St表示第t個子數(shù)據(jù)的特征編碼,t∈[1,n],t為正整數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕音樂有限公司;咪咕文化科技有限公司;中國移動通信集團有限公司,未經(jīng)咪咕音樂有限公司;咪咕文化科技有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110065077.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





