[發明專利]基于深度學習提高數據采集質量的方法和裝置在審
| 申請號: | 202010987992.7 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112131415A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 秦浩達 | 申請(專利權)人: | 北京影譜科技股份有限公司 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06F16/58;G06N3/08 |
| 代理公司: | 北京萬思博知識產權代理有限公司 11694 | 代理人: | 范曉斌 |
| 地址: | 100000 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 提高 數據 采集 質量 方法 裝置 | ||
1.一種基于深度學習提高數據采集質量的方法,包括:
設置多類標簽,每一類標簽對應多個標準圖片;
將所述多類標簽對應的所有圖片輸入神經網絡,通過正向傳播得到得分;
將所述得分輸入誤差函數計算得到誤差,通過反向傳播來確定梯度向量,并通過所述梯度向量按照使誤差趨于零或收斂的趨勢,調整所述神經網絡內每一層神經元權值,重復所述計算誤差及調整權值的步驟,直至調節次數達到指定次數或誤差損失的平均值不再下降,得到訓練模型;
當采集數據時,通過輸入標簽搜索數據,將搜索到的同一類標簽的圖片放在同一文件夾下,將所有標簽文件夾下的圖片輸入所述訓練模型得到每個標簽的置信度列表,根據所述置信度列表中誤識標簽的置信度,確定每一個標簽的置信度中值,對所有標簽的置信度中值求和后取均值,將所述均值設置為置信度閾值;
當數據采集完畢后,輸入標簽通過所述訓練模型計算出置信度,如果所述置信度高于所述置信度閾值,則將采集到的數據作為所述標簽的數據。
2.根據權利要求1所述的方法,其特征在于,將所述多類標簽對應的所有圖片輸入神經網絡,通過正向傳播得到得分,包括:
將所述多類標簽對應的所有圖片輸入神經網絡,每個神經元的輸入值經加權累加后,再輸入激活函數作為該神經元的輸出值,再通過正向傳播得到得分。
3.根據權利要求1所述的方法,其特征在于,將所述得分輸入誤差函數計算得到誤差,包括:
將所述得分輸入誤差函數,與期待值比較得到誤差,如果得到多個誤差則求和后作為誤差。
4.根據權利要求1所述的方法,其特征在于,根據所述置信度列表中誤識標簽的置信度,確定每一個標簽的置信度中值,包括:
查看每一個標簽的置信度列表,找出從哪一個置信度開始誤識所述標簽,將該開始誤識標簽的置信度確定為所述標簽的置信度中值。
5.根據權利要求1-4中任一項所述的方法,其特征在于,所述方法還包括:
當進行數據核對時,將所述置信度閾值調高指定的百分比,如果采集的數據不符合所述調高后的置信度閾值,則將所述數據予以刪除。
6.一種基于深度學習提高數據采集質量的裝置,包括:
設置模塊,其配置成設置多類標簽,每一類標簽對應多個標準圖片;
訓練模塊,其配置成將所述多類標簽對應的所有圖片輸入神經網絡,通過正向傳播得到得分;還配置成將所述得分輸入誤差函數計算得到誤差,通過反向傳播來確定梯度向量,并通過所述梯度向量按照使誤差趨于零或收斂的趨勢,調整所述神經網絡內每一層神經元權值,重復所述計算誤差及調整權值的步驟,直至調節次數達到指定次數或誤差損失的平均值不再下降,得到訓練模型;
采集模塊,其配置成當采集數據時,通過輸入標簽搜索數據,將搜索到的同一類標簽的圖片放在同一文件夾下,將所有標簽文件夾下的圖片輸入所述訓練模型得到每個標簽的置信度列表,根據所述置信度列表中誤識標簽的置信度,確定每一個標簽的置信度中值,對所有標簽的置信度中值求和后取均值,將所述均值設置為置信度閾值;
調整模塊,其配置成當數據采集完畢后,輸入標簽通過所述訓練模型計算出置信度,如果所述置信度高于所述置信度閾值,則將采集到的數據作為所述標簽的數據。
7.根據權利要求6所述的裝置,其特征在于,所述訓練模塊具體配置成:
將所述多類標簽對應的所有圖片輸入神經網絡,每個神經元的輸入值經加權累加后,再輸入激活函數作為該神經元的輸出值,再通過正向傳播得到得分。
8.根據權利要求6所述的裝置,其特征在于,所述訓練模塊具體配置成:
將所述得分輸入誤差函數,與期待值比較得到誤差,如果得到多個誤差則求和后作為誤差。
9.根據權利要求6所述的裝置,其特征在于,所述采集模塊具體配置成:
查看每一個標簽的置信度列表,找出從哪一個置信度開始誤識所述標簽,將該開始誤識標簽的置信度確定為所述標簽的置信度中值。
10.根據權利要求6-9中任一項所述的裝置,其特征在于,所述裝置還包括:
核對模塊,其配置成當進行數據核對時,將所述置信度閾值調高指定的百分比,如果采集的數據不符合所述調高后的置信度閾值,則將所述數據予以刪除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京影譜科技股份有限公司,未經北京影譜科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010987992.7/1.html,轉載請聲明來源鉆瓜專利網。





