[發(fā)明專利]多模態(tài)數(shù)據(jù)采集與標(biāo)注方法、裝置、計(jì)算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 202310431207.3 | 申請日: | 2023-04-20 |
| 公開(公告)號: | CN116541689A | 公開(公告)日: | 2023-08-04 |
| 發(fā)明(設(shè)計(jì))人: | 羅建楨;萬子龍;蔡君 | 申請(專利權(quán))人: | 廣東技術(shù)師范大學(xué) |
| 主分類號: | G06F18/213 | 分類號: | G06F18/213;G06F18/25;G06F18/24;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08;G06V10/764;G06V10/82;G05B19/05;G05B17/02 |
| 代理公司: | 佛山市知而行知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44935 | 代理人: | 潘黎 |
| 地址: | 510665 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多模態(tài) 數(shù)據(jù) 采集 標(biāo)注 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
1.一種多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,包括下述步驟:
獲取所述多模態(tài)數(shù)據(jù),所述多模態(tài)數(shù)據(jù)包括圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù);
對所述圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)進(jìn)行特征提取,獲取圖像特征和日志特征;
對所述圖像特征和日志特征進(jìn)行特征融合,得到圖像和日志融合特征;
根據(jù)所述圖像和日志融合特征,進(jìn)行模型訓(xùn)練;
將訓(xùn)練好的模型部署到實(shí)際場景中,實(shí)現(xiàn)對多模態(tài)數(shù)據(jù)的實(shí)時(shí)分析和處理。
2.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,所述獲取所述多模態(tài)數(shù)據(jù),所述多模態(tài)數(shù)據(jù)包括圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)的步驟具體包括:
將PLC外接到人機(jī)交互設(shè)備,進(jìn)行生產(chǎn)環(huán)境過程模擬;
通過工控協(xié)議,使得PLC接收到示數(shù)變化的信號后,所述人機(jī)交互設(shè)備上的傳感器示數(shù)也隨之改變,通過架設(shè)在所述人機(jī)交互設(shè)備旁的攝像機(jī)來定時(shí)捕捉所述人機(jī)交互設(shè)備信息,獲取圖像模態(tài)數(shù)據(jù);
根據(jù)所述PLC數(shù)據(jù)日志,獲取所述日志模態(tài)數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,在所述對所述圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)進(jìn)行特征提取,獲取圖像特征和日志特征的步驟之前,還包括:
對所述圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。
4.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,所述對所述圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)進(jìn)行特征提取,獲取圖像特征和日志特征的步驟具體包括:
采用卷積神經(jīng)網(wǎng)絡(luò),對所述圖像模態(tài)數(shù)據(jù)進(jìn)行特征提取,獲取圖像特征;
采用自然語言處理方式,采用基于長短時(shí)記憶網(wǎng)絡(luò)的序列模型,對所述日志模態(tài)數(shù)據(jù)進(jìn)行特征提取,獲取日志特征。
5.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,所述對所述圖像特征和日志特征進(jìn)行特征融合,得到圖像和日志融合特征的步驟具體包括:
對所述圖像特征和所述日志特征進(jìn)行歸一化處理;
將歸一化后的圖像特征和日志特征拼接成一個(gè)融合長特征向量;
使用所述融合長特征向量作為輸入,設(shè)計(jì)一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,所述深度神經(jīng)網(wǎng)絡(luò)模型包括多個(gè)全連接層,每個(gè)全連接層后接一個(gè)激活函數(shù)ReLU,在所述深度神經(jīng)網(wǎng)絡(luò)模型的輸出層,采用一個(gè)softmax激活函數(shù),用于輸出各個(gè)類別的概率分布;
輸出圖像和日志融合特征。
6.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,所述根據(jù)所述圖像和日志融合特征,進(jìn)行模型訓(xùn)練的步驟具體包括:
根據(jù)所述圖像和日志融合特征,使用隨機(jī)梯度下降優(yōu)化器,設(shè)定學(xué)習(xí)率為η,動量為m,損失函數(shù)選擇交叉熵?fù)p失,用于衡量模型預(yù)測與實(shí)際標(biāo)簽之間的差距,來作為對所述圖像模特?cái)?shù)據(jù)進(jìn)行模型訓(xùn)練與優(yōu)化,其中損失函數(shù)的形式為:
L(y,y_pred)=-∑y_i×log(y_pred_i);
y是實(shí)際標(biāo)簽的獨(dú)熱向量,y_pred是模型預(yù)測的概率分布,y_i表示真實(shí)值的第i個(gè)類別的概率,y_pred_i表示模型預(yù)測的第i個(gè)類別的概率;
根據(jù)所述圖像和日志融合特征,使用Adam優(yōu)化器,設(shè)定學(xué)習(xí)率為η,β1為0.9,β2為0.999,損失函數(shù)選擇交叉熵?fù)p失,激活函數(shù)為ReLU或者GELU,來優(yōu)化模型性能,其中β1指的是一階梯度的衰減因子,β2指的是二階梯度的衰減因子。
7.根據(jù)權(quán)利要求1所述的多模態(tài)數(shù)據(jù)采集與標(biāo)注方法,其特征在于,所述將訓(xùn)練好的模型部署到實(shí)際場景中,實(shí)現(xiàn)對多模態(tài)數(shù)據(jù)的實(shí)時(shí)分析和處理的步驟具體包括:
從訓(xùn)練好的模型中選擇最優(yōu)模型;
將最優(yōu)模型在訓(xùn)練集和驗(yàn)證集上進(jìn)行聯(lián)合訓(xùn)練,直至收斂;
將訓(xùn)練好的模型部署到實(shí)際應(yīng)用場景中,對新的圖像模態(tài)數(shù)據(jù)和日志模態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)分析和標(biāo)注。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東技術(shù)師范大學(xué),未經(jīng)廣東技術(shù)師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310431207.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識別方法及裝置
- 一種基于多模態(tài)生成式對抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語料庫數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺的方法、裝置、電子設(shè)備和存儲介質(zhì)





