[發(fā)明專利]一種主動學(xué)習(xí)樣本選取方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011003427.9 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112101263B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 呂文君;康宇;昌吉;許婷;李婧;李澤瑞 | 申請(專利權(quán))人: | 中國科學(xué)技術(shù)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N20/00 |
| 代理公司: | 合肥天明專利事務(wù)所(普通合伙) 34115 | 代理人: | 汪貴艷 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 主動 學(xué)習(xí) 樣本 選取 方法 系統(tǒng) 計(jì)算機(jī) 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種主動學(xué)習(xí)樣本選取方法,通過數(shù)據(jù)收集、系統(tǒng)初始化、生成隱藏層輸出矩陣、基分類器交叉優(yōu)化、在滿足一定判定條件后做出對目標(biāo)域樣本的選擇。基于該方法本發(fā)明又公開了一種主動學(xué)習(xí)的樣本選取系統(tǒng)以及對應(yīng)的計(jì)算機(jī)可讀存儲介質(zhì)。相較于已有的技術(shù),本發(fā)明公開的技術(shù)方案所選取的目標(biāo)樣本更加分散在數(shù)據(jù)分類界面處,能夠進(jìn)一步提升主動學(xué)習(xí)的效率、以及分類器的泛化性能,特別適用于解決例如基于振動信號的機(jī)器人地面分類、基于測井曲線的巖性識別、基于超光譜的遙感圖像處理等標(biāo)簽較為昂貴的任務(wù)。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)處理領(lǐng)域,具體涉及一種主動學(xué)習(xí)樣本選取方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
信息分類是信息處理、模式識別領(lǐng)域中一個(gè)非常重要的問題,分類方法的研究已成為當(dāng)前研究的熱門。各分類方法實(shí)現(xiàn)分類的關(guān)鍵問題是基于已標(biāo)注的樣本訓(xùn)練具有較高分類準(zhǔn)確率的分類器。目前使用一些傳統(tǒng)的監(jiān)督學(xué)習(xí)方法做分類的時(shí)候,往往是訓(xùn)練樣本規(guī)模越大,分類的效果就越好。但是在現(xiàn)實(shí)生活的很多場景中,標(biāo)記樣本的獲取是比較困難的,這需要領(lǐng)域內(nèi)的專家來進(jìn)行人工標(biāo)注,所花費(fèi)的時(shí)間成本和經(jīng)濟(jì)成本都是很大的。因此。為了在盡可能小的標(biāo)注代價(jià)下獲取較高的分類準(zhǔn)確率,現(xiàn)提出一種主動學(xué)習(xí)分類方法,其從原始的未標(biāo)注樣本集中篩選樣本,且需篩選出對訓(xùn)練的分類器而言信息含量較高的樣本進(jìn)行標(biāo)注。
主動學(xué)習(xí)方法一般可以分為兩部分:學(xué)習(xí)引擎和選擇引擎。其中學(xué)習(xí)引擎維護(hù)一個(gè)基準(zhǔn)分類器,并使用監(jiān)督學(xué)習(xí)算法對系統(tǒng)提供的已標(biāo)注樣例進(jìn)行學(xué)習(xí)從而使該分類器的性能提高;而選擇引擎負(fù)責(zé)運(yùn)行樣本選擇算法,選擇一個(gè)未標(biāo)注的樣例并將其交由人類專家進(jìn)行標(biāo)注,再將標(biāo)注后的樣本加入到已標(biāo)注樣例集中。故主動學(xué)習(xí)的關(guān)鍵在于如何主動地選取樣本并推薦給專家進(jìn)行標(biāo)注,進(jìn)而能夠以較小的標(biāo)注代價(jià)實(shí)現(xiàn)高性能分類器的訓(xùn)練。
機(jī)器人在自主導(dǎo)航的過程中,必須具備感知通過的路面類別信息從而穩(wěn)定安全地穿越未知地面的能力。所以機(jī)器人利用其機(jī)載傳感器(振動、觸覺、視覺、聽覺等)感知地面數(shù)據(jù),并將這些數(shù)據(jù)輸入到一個(gè)訓(xùn)練好的分類器中以獲取當(dāng)前移動地面的類型(草地、水泥地等)。機(jī)器人地面分類有助于機(jī)器人避險(xiǎn)、路徑規(guī)劃、航跡推算、姿態(tài)控制等,已經(jīng)成為自主化機(jī)器人的一個(gè)核心功能。專利CN202010105923.9公開了一種路面特征聚類分析的機(jī)器人速度自適應(yīng)控制方法,在復(fù)雜路面情況下,基于姿態(tài)傳感器獲取的運(yùn)動中機(jī)器人本體垂直方向的振動加速度信號,采用聚類算法完成對路面信息的聚類分析,獲得地面類型所處類別的概率,同時(shí)通過獲取分析機(jī)器人本體的俯仰角信號,對機(jī)器人所處的路面坡度進(jìn)行分類,最終通過決策完成對機(jī)器人的自適應(yīng)速度控制。其根據(jù)機(jī)器人本體的垂直方向振動加速度以及機(jī)器人所處路面的坡度實(shí)現(xiàn)機(jī)器人運(yùn)動速度的自適應(yīng)控制,在保證機(jī)器人運(yùn)動的穩(wěn)定性的前提下實(shí)現(xiàn)了機(jī)器人運(yùn)動的高效性,提高了機(jī)器人運(yùn)動控制的總體性能。類似研究較多,例如CN201910254116.0、CN201811118835.1等。
然而,目前現(xiàn)有的機(jī)器人地面分類領(lǐng)域幾乎沒有涉及到主動學(xué)習(xí),這意味著機(jī)器人地面分類模型的訓(xùn)練需要依賴大量的人工標(biāo)注;另外,已有的主動學(xué)習(xí)方法大多是基于單分類器的,因此其預(yù)測樣本不確定性的度量就存在一定的盲區(qū),某些關(guān)鍵樣本往往無法覆蓋,降低了選取樣本的整體價(jià)值。因此,現(xiàn)有的主動學(xué)習(xí)算法的精度還有提升的空間,其在機(jī)器人地面分類的應(yīng)用也能得到進(jìn)一步的加強(qiáng)。
發(fā)明內(nèi)容
本發(fā)明的發(fā)明目的是提供一種主動學(xué)習(xí)樣本選取方法、系統(tǒng)及計(jì)算機(jī)可讀存儲介質(zhì)。使選取的目標(biāo)樣本更加分散在數(shù)據(jù)分類界面處,以進(jìn)一步提升主動學(xué)習(xí)的效率、以及分類器的泛化性能。
具體的技術(shù)方案如下:
一種主動學(xué)習(xí)樣本選取方法,其包括以下步驟:
(1)數(shù)據(jù)收集:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)技術(shù)大學(xué),未經(jīng)中國科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011003427.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





