[發明專利]基于人工智能木板分選低置信度樣本處理方法及系統有效
| 申請號: | 201710966909.6 | 申請日: | 2017-10-17 |
| 公開(公告)號: | CN107832780B | 公開(公告)日: | 2020-04-10 |
| 發明(設計)人: | 丁磊 | 申請(專利權)人: | 北京木業邦科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 郝雅娟 |
| 地址: | 100040 北京市石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 木板 分選 置信 樣本 處理 方法 系統 | ||
技術領域
本發明屬于人工智能技術領域,具體涉及一種機器學習中低置信度樣本的處理方法、系統、機器學習中圖像樣本分類標注方法、系統及其計算機程序產品。
背景技術
在木材加工領域,木板分選是一個重要環節。原木在經過成型、上色、烘干等工藝之后,變為加工后的木板。木板在變為商品化產品之前,需要按照不同的板材特征進行產品分類。在傳統的方法中,木板的分選由人工完成。經過訓練的工人,通過觀察,判斷每一塊木板的顏色、紋理、缺陷,進而結合經驗將一塊木板歸入不同的分類。每一個分類之中的木板擁有更為接近的特性,實現較高的產品外觀、質量的一致性。
然而,使用人工的分選的方法需要耗費大量的人力資源,并且成本昂貴。由于每一批次的木板材質和上色工藝可能存在不同,每一次的產品分類標準也可能存在變動,因此需要不斷的對工人進行培訓和訓練。同時,隨著工作時間的增加,人力的方法也會出現準確率下降,效率變慢的現象。
使用機器進行木材分選的方法正成為當前行業的新興方向,在木材處理過程中的很多步驟可以通過機器的方法來解決。然而,這些技術多數使用一種固定方法對木材或木板進行特征提取,進而得到想要的特征。例如,US20120170055A1中給出了一種使用極化光照射木板,接收反射光信號。由于木紋方向是由纖維結構決定的,而纖維結構會對極化光信號造成影響。因此,通過對反射光的特征處理,進而可以識別木板的木紋方向。再例如,CN101767094A中給出了一種基于顏色和木紋進行分選的方法,該方法只是將人工的經驗轉變成列表,并根據木板的樣本與列表進行比對而獲得分類。以上的方法均屬于對木材的某一特征進行提取,使用一種固定的分類計算機算法,進而實現木板分選的目的。
根據以上描述,此類方法均存在一定的局限性,其一在于其分選參數和方法是固定的,必須通過專門的設計和調教才能有效運行。由于木材是一種非標準化產品,這就很難保障算法和參數總是與需求匹配的。在木材原材料供應、場地外部環境,產品能分類需求發生變動時,這些傳統的機器參數需要進行重新校準和重新測試,否則機器無法正常工作。此外,固定的參數在多變的部署環境中也變得極為不穩定,受光照、傳送帶等影響,調教好的參數必須同時保障非常高的運行環境,否則性能面臨巨大的下降。由此可見,傳統的方法在自適應,效率方面存在嚴重的不足。
隨著最近機器學習方面的研究進展,使用機器學習進行木材加工自動化的方法變得越來越受到歡迎。這是由于機器學習能夠通過海量的訓練數據,使得自動化機器變得更為可靠和彈性。同時,訓練的方法極為簡單,只需要對分類后的數據進行標注,并使用相應的算法訓練模型即可,而模型具體根據木材的哪些特征,如何進行分類則無需人工干預。也就是說,機器學習的方法拋棄了對具體分類模型、算法、圖像特征的依賴,只需要采集足夠多的數據,就可以實現對原木、木板等非標準化產品的分類。然而,目前的機器學習依賴于足夠的數據量,當數據量規模不夠大時,機器學習的精確度大為下降。
由于快速變化的消費需求,當前木板生產中對快速部署的需求變得越來越高。每家木板生產廠商都擁有自定義的木板分類標準,也就是說分類的標準也變成了一種非標準化的過程。使用一種預先訓練的機器學習方法,并部署到每一家生產廠商的方法無法實現自定義的木板分類標準。另外一個重要的問題在于,每一批次的產品都基于同一批次的原木供應,該批次最終的產品分類與該批次的原木材質,噴漆工藝高度相關。也就是說,對于每一批次的分類方法,都需要一個全新的機器學習算法。最后,自然光線的改變對機器學習算法的影響并沒有在現有技術中得到考慮,因此傳統的機器學習方法無法適應光照條件變化的生產環境。
在木板分選領域應用機器學習的方法,面臨一個與其他機器學習沒有遇到的問題。機器學習依賴于大量的訓練數據,在一般領域,這些數據可以離線獲取,并且可以輕易獲得足夠多的訓練數據。然而,在上述木板分選場景,每個工廠的分類都是自定義的,其木板源也是有限的。因此,訓練數據的獲取就難以輕易得到滿足。在機器學習的方法運行時,會產生低置信度的樣本,也就是分類算法無法在較高置信度的情況下判斷該樣本的分類。此時,該樣本在多個分類中的置信度評估值接近,因此機器無法給出分類判斷。然而,這些低置信度樣本的巧妙使用可以實現一種迭代的改進機器學習精度的方法,也就是說,通過不斷發現低置信度的樣本并加以利用,可以使得機器學習方法逐漸的提升其分類精度。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京木業邦科技有限公司,未經北京木業邦科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710966909.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軌道站點分類系統
- 下一篇:一種面向多源數據的軟件缺陷表示學習方法





