[發(fā)明專利]多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201710570848.1 | 申請(qǐng)日: | 2017-07-13 |
| 公開(kāi)(公告)號(hào): | CN107480194B | 公開(kāi)(公告)日: | 2020-03-13 |
| 發(fā)明(設(shè)計(jì))人: | 徐常勝;鮑秉坤 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06N20/00 |
| 代理公司: | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11482 | 代理人: | 郭文浩;王世超 |
| 地址: | 100080 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多模態(tài) 知識(shí) 表示 自動(dòng) 學(xué)習(xí) 模型 構(gòu)建 方法 系統(tǒng) | ||
1.一種多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述構(gòu)建方法包括:
從互聯(lián)網(wǎng)的數(shù)據(jù)中挖掘出結(jié)構(gòu)化的文本集;
從互聯(lián)網(wǎng)的數(shù)據(jù)中挖掘出結(jié)構(gòu)化的圖片集;
根據(jù)所述結(jié)構(gòu)化的文本集和圖片集,構(gòu)建統(tǒng)一特征空間的自動(dòng)學(xué)習(xí)模型,用于確定多模態(tài)待檢測(cè)信息的知識(shí)向量;
其中,所述根據(jù)所述結(jié)構(gòu)化的文本集和圖片集,構(gòu)建統(tǒng)一特征空間的自動(dòng)學(xué)習(xí)模型,具體包括:
根據(jù)所述結(jié)構(gòu)化的圖片集中的各圖片信息學(xué)習(xí)結(jié)構(gòu)化文本的知識(shí)表示,確定第一優(yōu)化目標(biāo)函數(shù);
根據(jù)所述結(jié)構(gòu)化的文本集中的各結(jié)構(gòu)化文本表示學(xué)習(xí)圖片的知識(shí)表示,確定第二優(yōu)化目標(biāo)函數(shù);
根據(jù)所述學(xué)習(xí)圖片的知識(shí)表示與總體優(yōu)化目標(biāo)函數(shù)進(jìn)行迭代確定自動(dòng)學(xué)習(xí)模型。
2.根據(jù)權(quán)利要求1所述的多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述從互聯(lián)網(wǎng)的文本數(shù)據(jù)中挖掘出結(jié)構(gòu)化的文本集,具體包括:
利用信息抽取工具,將互聯(lián)網(wǎng)的文本數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化表示,確定候選結(jié)構(gòu)化文本集;
利用詞典數(shù)據(jù)庫(kù),對(duì)所述候選結(jié)構(gòu)化文本集進(jìn)行初次過(guò)濾,刪除不包含屬于實(shí)體的結(jié)構(gòu)化文本數(shù)據(jù),獲得初濾結(jié)構(gòu)化文本集;
利用文本搜索引擎,對(duì)所述初濾結(jié)構(gòu)化文本集進(jìn)行二次過(guò)濾,獲得結(jié)構(gòu)化文本集。
3.根據(jù)權(quán)利要求2所述的多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述利用文本搜索引擎,對(duì)所述初濾結(jié)構(gòu)化文本集進(jìn)行二次過(guò)濾,具體包括:
將所述初濾結(jié)構(gòu)化文本集中的各結(jié)構(gòu)化文本數(shù)據(jù)連接成句子;
將各所述句子分別輸入至搜索引擎中進(jìn)行搜索,如果返回相關(guān)網(wǎng)頁(yè),則保留所述句子對(duì)應(yīng)的結(jié)構(gòu)化文本數(shù)據(jù);否則,刪除所述句子對(duì)應(yīng)的結(jié)構(gòu)化文本數(shù)據(jù),保留的各結(jié)構(gòu)化文本數(shù)據(jù)形成結(jié)構(gòu)化文本集。
4.根據(jù)權(quán)利要求1所述的多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述從互聯(lián)網(wǎng)的圖片數(shù)據(jù)中挖掘出結(jié)構(gòu)化的圖片集,具體包括:
根據(jù)所述結(jié)構(gòu)化的文本集,采用圖片搜索引擎從互聯(lián)網(wǎng)的圖片數(shù)據(jù)中獲得候選結(jié)構(gòu)化圖片數(shù)據(jù)集;
根據(jù)結(jié)構(gòu)化圖片的可表示力,刪除所述候選結(jié)構(gòu)化圖片數(shù)據(jù)集中無(wú)效圖片,獲得初濾結(jié)構(gòu)化圖片數(shù)據(jù)集;
對(duì)所述初濾結(jié)構(gòu)化圖片數(shù)據(jù)集進(jìn)行噪聲過(guò)濾,獲得結(jié)構(gòu)化的圖片集。
5.根據(jù)權(quán)利要求4所述的多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述根據(jù)結(jié)構(gòu)化圖片的可表示力,刪除所述候選結(jié)構(gòu)化圖片數(shù)據(jù)集中無(wú)效圖片,具體包括:
根據(jù)以下公式確定圖片組Vi的可表示力φ(Vi):
其中,每一個(gè)結(jié)構(gòu)化文本Si具有表示相同知識(shí)的一組圖片記為Vi,i是索引號(hào),圖片組Vi中含有Ni張圖片,Cent(Vi)是第i組圖片的中心,dist(k,Cent(Vi))表示第i組圖片組Vi中圖片k和中心Cent(Vi)之間的距離;
判斷所述圖片組Vi的可表示力φ(Vi)是否大于可表示力閾值,如果大于,則可表示力對(duì)應(yīng)的圖片組為無(wú)效,刪除無(wú)效圖片組;否則保留對(duì)應(yīng)的圖片組;保留的各圖片組形成初濾結(jié)構(gòu)化圖片數(shù)據(jù)集。
6.根據(jù)權(quán)利要求5所述的多模態(tài)知識(shí)表示自動(dòng)學(xué)習(xí)模型的構(gòu)建方法,其特征在于,所述對(duì)所述初濾結(jié)構(gòu)化圖片數(shù)據(jù)集進(jìn)行噪聲過(guò)濾,具體包括:
根據(jù)以下公式,計(jì)算圖片組Vi中圖片k的噪聲分?jǐn)?shù)Snoisy(k):
其中,j表示圖片組Vi中的圖片,dist(k,j)表示第i組圖片組Vi中圖片k和圖片j之間的距離;
判斷所述噪聲分?jǐn)?shù)是否大于噪聲閾值,如果大于,則刪除對(duì)應(yīng)噪聲分?jǐn)?shù)圖片組中的圖片;否則保留,保留下的圖片組形成結(jié)構(gòu)化的圖片集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710570848.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





