[發(fā)明專利]模型數(shù)據(jù)集的建立方法及云系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810096270.5 | 申請(qǐng)日: | 2018-01-31 |
| 公開(公告)號(hào): | CN108197668A | 公開(公告)日: | 2018-06-22 |
| 發(fā)明(設(shè)計(jì))人: | 梁昊;南一冰;廉士國(guó) | 申請(qǐng)(專利權(quán))人: | 達(dá)闥科技(北京)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 北京新知遠(yuǎn)方知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11397 | 代理人: | 申楠;劉玲 |
| 地址: | 100102 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型數(shù)據(jù) 分類模型 分類標(biāo)記 分類識(shí)別 數(shù)據(jù)集中 數(shù)據(jù)集 云系統(tǒng) 建立模型 聚類結(jié)果 人工標(biāo)注 時(shí)間成本 數(shù)據(jù)特征 自動(dòng)標(biāo)注 校驗(yàn) 初始化 聚類 申請(qǐng) 測(cè)試 | ||
1.一種模型數(shù)據(jù)集的建立方法,其特征在于,包括:
根據(jù)選取的數(shù)據(jù)特征對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行聚類,并根據(jù)聚類結(jié)果對(duì)所述數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分類標(biāo)記;
根據(jù)分類標(biāo)記后的數(shù)據(jù)集對(duì)初始化分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型;
對(duì)訓(xùn)練好的分類模型進(jìn)行測(cè)試,并根據(jù)測(cè)試結(jié)果建立模型數(shù)據(jù)集。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)選取的數(shù)據(jù)特征對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行聚類,包括:
從預(yù)設(shè)的特征集中選取作為聚類依據(jù)的數(shù)據(jù)特征;
根據(jù)所選取的數(shù)據(jù)特征,提取數(shù)據(jù)集中數(shù)據(jù)的數(shù)據(jù)特征;
對(duì)提取的數(shù)據(jù)特征進(jìn)行聚類。
3.如權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)的特征集中的數(shù)據(jù)特征包括用于表征圖像顏色、邊緣、紋理中的一種或者多種的人工設(shè)定特征,以及分類模型每一層的輸出特征。
4.如權(quán)利要求1所述的方法,其特征在于,所述分類標(biāo)記后的數(shù)據(jù)集包括訓(xùn)練集,所述根據(jù)分類標(biāo)記后的數(shù)據(jù)集對(duì)初始化分類模型進(jìn)行訓(xùn)練為,根據(jù)所述訓(xùn)練集對(duì)初始化分類模型進(jìn)行訓(xùn)練。
5.如權(quán)利要求1或4所述的方法,其特征在于,所述分類標(biāo)記后的數(shù)據(jù)集包括測(cè)試集,所述對(duì)訓(xùn)練好的分類模型進(jìn)行測(cè)試,并根據(jù)測(cè)試結(jié)果建立模型數(shù)據(jù)集,包括:
根據(jù)所述測(cè)試集對(duì)訓(xùn)練好的分類模型進(jìn)行測(cè)試,得到訓(xùn)練好的分類模型的分類準(zhǔn)確率;
根據(jù)所述分類準(zhǔn)確率建立模型數(shù)據(jù)集。
6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述測(cè)試集對(duì)訓(xùn)練好的分類模型進(jìn)行測(cè)試,得到訓(xùn)練好的分類模型的分類準(zhǔn)確率,包括:
利用訓(xùn)練好的分類模型對(duì)所述測(cè)試集中的數(shù)據(jù)進(jìn)行分類,得到數(shù)據(jù)的分類結(jié)果;
將所述分類結(jié)果與所述測(cè)試集中數(shù)據(jù)的分類標(biāo)記進(jìn)行比對(duì),得到訓(xùn)練好的分類模型的分類準(zhǔn)確率。
7.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述分類準(zhǔn)確率建立模型數(shù)據(jù)集,包括:
若所述分類準(zhǔn)確率大于設(shè)定值,則根據(jù)所述測(cè)試集中數(shù)據(jù)的分類標(biāo)記生成模型數(shù)據(jù)集;
若所述分類準(zhǔn)確率小于或等于設(shè)定值,則重新選取作為聚類依據(jù)的數(shù)據(jù)特征。
8.一種模型數(shù)據(jù)集的建立云系統(tǒng),其特征在于,包括:
聚類服務(wù)器,用于根據(jù)選取的數(shù)據(jù)特征對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行聚類,并根據(jù)聚類結(jié)果對(duì)所述數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分類標(biāo)記;
訓(xùn)練服務(wù)器,用于根據(jù)分類標(biāo)記后的數(shù)據(jù)集對(duì)初始化分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型;
測(cè)試服務(wù)器,用于對(duì)訓(xùn)練好的分類模型進(jìn)行測(cè)試,并根據(jù)測(cè)試結(jié)果建立模型數(shù)據(jù)集。
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
收發(fā)設(shè)備,存儲(chǔ)器,一個(gè)或多個(gè)處理器;以及
一個(gè)或多個(gè)模塊,所述一個(gè)或多個(gè)模塊被存儲(chǔ)在所述存儲(chǔ)器中,并被配置成由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)模塊包括用于執(zhí)行權(quán)利要求1-7中任一所述方法中各個(gè)步驟的指令。
10.一種與電子設(shè)備結(jié)合使用的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)和內(nèi)嵌于其中的計(jì)算機(jī)程序機(jī)制,所述計(jì)算機(jī)程序機(jī)制包括用于執(zhí)行權(quán)利要求1-7中任一所述方法中各個(gè)步驟的指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于達(dá)闥科技(北京)有限公司,未經(jīng)達(dá)闥科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810096270.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)模型對(duì)偶化
- 模型轉(zhuǎn)換方法及裝置
- 基于數(shù)據(jù)庫(kù)的自描述數(shù)據(jù)模型結(jié)構(gòu)
- 一種界面原型數(shù)據(jù)生成方法和計(jì)算機(jī)設(shè)備
- 一種機(jī)器學(xué)習(xí)平臺(tái)及基于該平臺(tái)的數(shù)據(jù)模型優(yōu)化方法
- 一種數(shù)據(jù)模型監(jiān)控方法
- 一種數(shù)據(jù)挖掘模型發(fā)布方法及模型和模型服務(wù)管理方法
- 一種數(shù)據(jù)挖掘系統(tǒng)及方法
- 動(dòng)態(tài)本體數(shù)據(jù)操作
- 基于NoSQL的PSD-BPA數(shù)據(jù)解析及管理方法及系統(tǒng)
- 使用大型數(shù)據(jù)庫(kù)進(jìn)行對(duì)象識(shí)別的系統(tǒng)及方法
- 一種圖像分類方法及裝置
- 分類模型訓(xùn)練方法及裝置
- 文本分類號(hào)的確定方法、裝置以及電子設(shè)備
- 文本分類方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 圖像分類模型的訓(xùn)練、圖像分類方法、裝置、設(shè)備及介質(zhì)
- 基于深度學(xué)習(xí)的圖像分類方法、裝置、服務(wù)器及介質(zhì)
- 模型生成方法、文本分類方法、裝置、設(shè)備及介質(zhì)
- 一種數(shù)據(jù)分類方法、裝置及系統(tǒng)
- 一種從局部到整體感知的電網(wǎng)場(chǎng)景預(yù)警分類方法及系統(tǒng)
- 使用潛在子標(biāo)記來學(xué)習(xí)用于視頻注釋的標(biāo)記
- 一種可擴(kuò)展的多層集成多標(biāo)記學(xué)習(xí)系統(tǒng)
- 特征選擇和標(biāo)記相關(guān)性聯(lián)合學(xué)習(xí)的多標(biāo)記數(shù)據(jù)分類方法
- 一種基于標(biāo)記協(xié)方差和多標(biāo)記分類的聯(lián)合學(xué)習(xí)方法
- 骨髓細(xì)胞標(biāo)記方法和系統(tǒng)
- 一種分類模型構(gòu)建方法及裝置
- 分類模型的評(píng)估方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種多標(biāo)記分類中潛在類別發(fā)現(xiàn)和分類方法
- X光圖像的智能分割方法及終端
- 一種面向?qū)哟螛?biāo)記樣本的隱多標(biāo)記分類方法
- 圖片分類方法、裝置和移動(dòng)終端
- 文本的情感識(shí)別方法、裝置、服務(wù)器以及存儲(chǔ)介質(zhì)
- 分類模型的訓(xùn)練方法、分類OCR識(shí)別結(jié)果的方法及裝置
- 圖像識(shí)別方法和裝置
- 一種對(duì)象分類方法、裝置、以及電子設(shè)備
- 一種基于深度學(xué)習(xí)的證件圖片識(shí)別方法、裝置及設(shè)備
- 一種遠(yuǎn)洋船舶分類方法
- 遠(yuǎn)程人臉識(shí)別方法及系統(tǒng)
- 智能分類垃圾箱及分類識(shí)別方法
- 內(nèi)容識(shí)別分類方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)





