[發明專利]用于對線上系統的模型進行更新的方法以及裝置在審
| 申請號: | 201810581927.7 | 申請日: | 2018-06-07 |
| 公開(公告)號: | CN108932299A | 公開(公告)日: | 2018-12-04 |
| 發明(設計)人: | 王鵬;孫亞昊;盧江虎 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京市磐華律師事務所 11336 | 代理人: | 高偉;劉愛平 |
| 地址: | 100190 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 線上系統 訓練集 對線 標注 抓取 方法和裝置 更新 標注信息 數據集中 數據添加 數據形成 增量數據 數據集 迭代 學習 | ||
本發明提供了一種用于對線上系統的模型進行更新的方法和裝置。該方法包括:從線上系統抓取數據,并形成數據集;獲取對所述數據集中的數據的標注信息;將標注后的數據添加至訓練集,以便訓練得到新的模型。由此可見,本發明實施例能夠從線上系統抓取數據形成增量數據集,并對其中的數據進行標注,標注后的數據被添加至訓練集,進而該訓練集能夠用于訓練生成新的模型,用于實現對線上系統的模型的更新。本發明實施例所提供的方法和裝置能夠便于對基于深度學習的線上系統中模型的更新迭代。
技術領域
本發明涉及圖像處理領域,更具體地涉及一種用于對線上系統的模型進行更新的方法以及裝置。
背景技術
深度學習已經在多個行業中有個廣泛的應用。在產品化應用深度學習的過程中,數據與深度學習模型同等重要。然而,在產品化深度學習之后,在產品迭代的過程中,數據集隨著產品運營逐步增長,深度學習模型需要跟隨最新的數據集不斷訓練,推陳出新。然而現有產品對增量數據集的標注支持有限,甚至無法進行增量數據集的標注。
發明內容
本發明提供了一種用于對線上系統的模型進行更新的方法以及裝置,能夠形成增量數據集,并對其中的數據進行標注,進而添加至訓練集,用于對在線系統的模型進行更新。
根據本發明的一方面,提供了一種用于對線上系統的模型進行更新的方法,包括:
從線上系統抓取數據,并形成數據集;
獲取對所述數據集中的數據的標注信息;
將標注后的數據添加至訓練集,以便訓練得到新的模型。
在本發明的一種實現方式中,
提供標注頁面,所述標注頁面包括左側區域和右側區域,所述右側區域包括右上側區域和右下側區域,
其中,所述左側區域用于呈現當前所標注的數據集的基本信息和統計信息,以及用于跳轉到其他頁面的按鈕;所述右上側區域用于呈現與標注功能有關的按鈕或選擇框;所述右下側區域用于呈現待標注數據。
在本發明的一種實現方式中,
所述右下側區域所呈現的所述待標注數據為縮略圖,所述待標注數據多行排列,每行的高度彼此相等,并且行與行之間的間隙彼此相等。
在本發明的一種實現方式中,所述獲取對所述數據集中的數據的標注信息,包括:
獲取所述縮略圖被標注的標注類別;
將所述縮略圖呈現為與所述標注類別所對應的顏色和/或數字。
在本發明的一種實現方式中,所述從線上系統抓取數據,并形成數據集,包括:
從線上系統抓取數據以及所述數據的評估結果;
對不同的評估結果采用不同的權重進行隨機取樣,形成所述數據集。
在本發明的一種實現方式中,還包括:
為不同的用戶設定頁面訪問和/或操作的權限。
在本發明的一種實現方式中,還包括:
獲得數據集的各個統計信息,并將所述各個統計信息通過圖表形式進行展示。
在本發明的一種實現方式中,所述統計信息包括以下中至少一項:
檢出數、總攻擊數、漏檢數、漏檢率。
在本發明的一種實現方式中,還包括:
清洗添加到所述訓練集中的數據,以將錯誤標注的數據進行修正或剔除。
在本發明的一種實現方式中,所述清洗添加到所述訓練集中的數據,以將錯誤標注的數據進行修正或剔除,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810581927.7/2.html,轉載請聲明來源鉆瓜專利網。





