[發(fā)明專利]一種數(shù)據(jù)匹配方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202110757520.7 | 申請(qǐng)日: | 2021-07-05 |
| 公開(公告)號(hào): | CN113642603B | 公開(公告)日: | 2023-04-28 |
| 發(fā)明(設(shè)計(jì))人: | 左凱;徐瑞聰;周鑫;黃彥春;馬潮;李東帥;曹佐 | 申請(qǐng)(專利權(quán))人: | 北京三快在線科技有限公司 |
| 主分類號(hào): | G06F18/24 | 分類號(hào): | G06F18/24 |
| 代理公司: | 北京曼威知識(shí)產(chǎn)權(quán)代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 匹配 方法 裝置 存儲(chǔ) 介質(zhì) 電子設(shè)備 | ||
本說明書公開了一種數(shù)據(jù)匹配方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備。采用若干種方式劃分待匹配數(shù)據(jù)以得到所劃分出的子數(shù)據(jù),根據(jù)各子數(shù)據(jù)之間的注意力權(quán)重確定出各子數(shù)據(jù)的融合數(shù)據(jù)特征,并根據(jù)各子數(shù)據(jù)的融合數(shù)據(jù)特征確定待匹配數(shù)據(jù)之間的匹配結(jié)果。采用不同劃分方式所劃分出的同一模態(tài)的子數(shù)據(jù)之間能夠?qū)崿F(xiàn)信息互補(bǔ),從而避免在根據(jù)僅通過一種劃分方式所劃分出的子數(shù)據(jù)來確定待匹配數(shù)據(jù)的匹配結(jié)果時(shí),由劃分方式的固有缺陷所帶來的匹配結(jié)果偏差。
技術(shù)領(lǐng)域
本說明書涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種數(shù)據(jù)匹配方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備。
背景技術(shù)
與人類可以通過眼睛、耳朵和鼻子來感知信息相類似,人工智能也可以接收多模態(tài)的信號(hào),例如圖像模態(tài)、文本模態(tài)或音頻模態(tài)等等。而由于不同模態(tài)的信號(hào)中所包含的數(shù)據(jù)對(duì)信息描述的方式不同,來自于多模態(tài)信號(hào)的數(shù)據(jù)(以下簡(jiǎn)稱多模態(tài)數(shù)據(jù))之間所包含的信息存在交叉互補(bǔ),因此相比于來自于單一模態(tài)信號(hào)的數(shù)據(jù)(以下簡(jiǎn)稱單模態(tài)數(shù)據(jù)),多模態(tài)數(shù)據(jù)能夠描述更豐富的信息。
但理解多模態(tài)數(shù)據(jù)之前,需要先獲知各模態(tài)的數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,也就是將各模態(tài)的數(shù)據(jù)進(jìn)行匹配。例如電影視頻和字幕在時(shí)間維度上的對(duì)應(yīng)關(guān)系,或是圖像和對(duì)圖像所進(jìn)行描述的文本之間的對(duì)應(yīng)關(guān)系,顯然,只有在建立了對(duì)應(yīng)關(guān)系的基礎(chǔ)之上,才能夠融合并理解多模態(tài)數(shù)據(jù)。
以為圖像和文本確定匹配關(guān)系為例,在現(xiàn)有技術(shù)中,通常采用目標(biāo)檢測(cè)算法從圖像中截取出若干包含完整語義的局部圖像,并根據(jù)各局部圖像中所包含的語義與文本的語義的近似程度來判斷整體圖像與文本是否匹配。
但這種方法對(duì)于目標(biāo)檢測(cè)算法本身的依賴程度過大,當(dāng)目標(biāo)檢測(cè)算法漏截取了局部圖像,就會(huì)導(dǎo)致局部圖像中所包含的信息丟失,從而導(dǎo)致所確定出的整體圖像與文本的匹配結(jié)果出現(xiàn)偏差。
可以看出,如何匹配來自不同模態(tài)的數(shù)據(jù)是一個(gè)亟待解決的問題。
發(fā)明內(nèi)容
本說明書提供一種數(shù)據(jù)匹配方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備,以部分的解決現(xiàn)有技術(shù)存在的上述問題。
本說明書采用下述技術(shù)方案:
本說明書提供了一種數(shù)據(jù)匹配方法,包括:
確定由不同模態(tài)類型的待匹配數(shù)據(jù)所構(gòu)成的待匹配數(shù)據(jù)對(duì);
針對(duì)每個(gè)待匹配數(shù)據(jù),針對(duì)預(yù)先設(shè)定的每種劃分方式,采用該劃分方式劃分該待匹配數(shù)據(jù),得到所劃分出的子數(shù)據(jù),并將所劃分出的子數(shù)據(jù)加入子數(shù)據(jù)集;
提取子數(shù)據(jù)集中各子數(shù)據(jù)的數(shù)據(jù)特征,并將所提取出的數(shù)據(jù)特征輸入預(yù)先訓(xùn)練的數(shù)據(jù)匹配模型;
根據(jù)各子數(shù)據(jù)的數(shù)據(jù)特征,針對(duì)每個(gè)子數(shù)據(jù),通過所述數(shù)據(jù)匹配模型,確定該子數(shù)據(jù)對(duì)各子數(shù)據(jù)的注意力權(quán)重,并根據(jù)該子數(shù)據(jù)對(duì)各子數(shù)據(jù)的注意力權(quán)重確定該子數(shù)據(jù)的融合數(shù)據(jù)特征;
根據(jù)各子數(shù)據(jù)的融合數(shù)據(jù)特征,確定所述待匹配數(shù)據(jù)對(duì)中不同模態(tài)的待匹配數(shù)據(jù)的匹配結(jié)果。
可選地,預(yù)先設(shè)定的各劃分方式中至少包括第一劃分方式;
采用第一劃分方式劃分待匹配數(shù)據(jù),具體包括:
將該待匹配數(shù)據(jù)自身劃分為該待匹配數(shù)據(jù)的子數(shù)據(jù)。
可選地,針對(duì)預(yù)先設(shè)定的各劃分方式中的每種劃分方式,采用該劃分方式劃分該待匹配數(shù)據(jù),具體包括:
確定該待匹配數(shù)據(jù)的模態(tài)類型,作為目標(biāo)模態(tài)類型;
根據(jù)預(yù)先設(shè)定的所述目標(biāo)模態(tài)類型對(duì)應(yīng)的各劃分方式,將所述目標(biāo)模態(tài)類型對(duì)應(yīng)的各劃分方式作為該待匹配數(shù)據(jù)對(duì)應(yīng)的劃分方式;
針對(duì)該待匹配數(shù)據(jù)對(duì)應(yīng)的每種劃分方式,采用該劃分方式劃分該待匹配數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三快在線科技有限公司,未經(jīng)北京三快在線科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110757520.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





