[發(fā)明專利]一種確定訓(xùn)練樣本的方法在審
| 申請?zhí)枺?/td> | 201610865525.0 | 申請日: | 2016-09-29 |
| 公開(公告)號: | CN107886512A | 公開(公告)日: | 2018-04-06 |
| 發(fā)明(設(shè)計)人: | 劉康偉;郝宇 | 申請(專利權(quán))人: | 法樂第(北京)網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司11315 | 代理人: | 許志勇 |
| 地址: | 100026 北京市朝*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 訓(xùn)練 樣本 方法 | ||
技術(shù)領(lǐng)域
本申請涉及模型訓(xùn)練技術(shù)領(lǐng)域,尤其涉及一種確定訓(xùn)練樣本的方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,機器學(xué)習(Machine Learning,ML)技術(shù)作為一種新的技術(shù),越來越受到人們的重視。在視頻監(jiān)控、智能交通、無人車駕駛等領(lǐng)域廣泛應(yīng)用的場景語義理解技術(shù)正是基于機器學(xué)習理論,利用大量的人工標注的圖像樣本進行訓(xùn)練,從而學(xué)習得到一個滿足任務(wù)需求的場景理解模型來實現(xiàn)的。機器學(xué)習技術(shù)通過對具體場景的圖像進行分析,該分析結(jié)果能夠為后續(xù)的具體應(yīng)用過程提供幫助。在實際應(yīng)用中,對圖像的分析過程可以通過所建立的數(shù)學(xué)模型來實現(xiàn),比如,可以通過所建立的數(shù)學(xué)模型,對無人駕駛車所采集的圖像進行分析,從而根據(jù)分析結(jié)果確定出安全行駛的路徑。
通常為了提高數(shù)學(xué)模型所獲得的分析結(jié)果的準確性,在數(shù)學(xué)模型的建立過程中,需要大量的訓(xùn)練樣本對該數(shù)學(xué)模型進行訓(xùn)練,這些訓(xùn)練樣本通過對圖像中的標注對象(例如,人、車、交通標注牌、建筑物、樹、天空等)進行人工標注而獲得。在人工標注過程中,標注者需要逐一找出待標注圖像中的標注對象,并對各個標注對象進行標注,然后根據(jù)標注后的圖像得到訓(xùn)練樣本。
然而,這種通過人工標注來獲得訓(xùn)練樣本的方式通常效率較低,當所需要的訓(xùn)練樣本數(shù)量較多時,該方式并不適用。
發(fā)明內(nèi)容
本申請實施例提供一種確定訓(xùn)練樣本的方法,用于解決現(xiàn)有技術(shù)中的問題。
本申請實施例提供了一種確定訓(xùn)練樣本的方法,該方法包括:
確定待標注的目標圖像;
通過超像素分割算法將所述目標圖像分割為多個超像素區(qū)塊;
基于所劃分的各所述超像素區(qū)塊對所述目標圖像中的標注對象進行標注,并根據(jù)標注后的目標圖像確定訓(xùn)練樣本。
優(yōu)選的,基于所劃分的各所述超像素區(qū)塊對所述目標圖像中的標注對象進行標注,具體包括:
確定初始標注框;
根據(jù)所述初始標注框所串連的超像素區(qū)塊,確定用于對所述標注對象進行標注的目標標注框,以實現(xiàn)對所述目標圖像中的標注對象進行標注。
優(yōu)選的,根據(jù)所述初始標注框所串連的超像素區(qū)塊,確定用于對所述標注對象進行標注的目標標注框,具體包括:
根據(jù)所述初始標注框所串連的超像素區(qū)塊,將所串連的超像素區(qū)塊的外側(cè)邊緣連接并作為所述目標標注框。
優(yōu)選的,根據(jù)所述初始標注框所串連的超像素區(qū)塊,確定用于對所述標注對象進行標注的目標標注框,具體包括:
根據(jù)所述初始標注框所串連的超像素區(qū)塊,將所串連的超像素區(qū)塊的內(nèi)側(cè)邊緣連接并作為所述目標標注框。
優(yōu)選的,基于所劃分的各所述超像素區(qū)塊對所述目標圖像中的標注對象進行標注,具體包括:
將被鼠標點擊和/或被觸控的超像素區(qū)塊作為所述目標圖像中的標注對象進行標注。
優(yōu)選的,所述通過超像素分割算法將所述目標圖像分割為多個超像素區(qū)塊,具體包括:
從所述目標圖像的各像素中確定出K個目標像素,將所述目標像素在顏色空間中的值作為初始聚類中心,所述K為大于或等于2的正整數(shù);
將所述目標圖像的各像素分別作為當前像素,確定所述當前像素在顏色空間中的值與鄰近的各所述初始聚類中心的距離,將所述當前像素分配到距離最小的初始聚類中心所對應(yīng)的初始超像素區(qū)塊;
確定各所述初始超像素區(qū)塊的聚類中心;
將各所述聚類中心作為新初始聚類中心,根據(jù)各所述新初始聚類中心將所述目標圖像中的各像素重新進行分配并生成對應(yīng)的新初始超像素區(qū)塊,直至第一代價函數(shù)的值收斂,所述第一代價函數(shù)用于度量所述超像素分割算法的完成情況;
將所述第一代價函數(shù)的值收斂時所生成的各初始超像素區(qū)塊作為所需要的超像素區(qū)塊,以實現(xiàn)對目標圖像的分割。
優(yōu)選的,從所述目標圖像的各像素中確定出K個像素,具體包括:
將所述目標圖像劃分為K個網(wǎng)格;
將各所述網(wǎng)格中心位置的像素確定為對應(yīng)的目標像素,或分別在各所述網(wǎng)格中隨機抽取像素作為對應(yīng)的目標像素。
優(yōu)選的,通過如下方法確定當前像素與初始聚類中心是否鄰近:
當所述當前像素與所述初始聚類中心之間間隔的像素的數(shù)量小于預(yù)設(shè)閾值時,確定所述當前像素與所述初始聚類中心鄰近。
優(yōu)選的,確定各所述初始超像素區(qū)塊的聚類中心,具體包括:
將各所述初始超像素區(qū)塊分別作為當前初始超像素區(qū)塊,將所述當前初始超像素區(qū)塊中各像素分別在顏色空間中對應(yīng)的值的平均值確定為所述當前初始超像素區(qū)塊對應(yīng)的聚類中心。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于法樂第(北京)網(wǎng)絡(luò)科技有限公司,未經(jīng)法樂第(北京)網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610865525.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





