[發明專利]使用機器學習對字符串進行分類在審
| 申請號: | 201880059456.1 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN111095296A | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | P·杜克;程抒星 | 申請(專利權)人: | 雪佛龍美國公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 曹瑾 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 機器 學習 字符串 進行 分類 | ||
1.一種用于對PID圖像中的字符模式進行分類的機器學習模型實現的方法,所述方法包括:
利用訓練數據生成邏輯電路生成合成字符訓練圖像集合;
利用符號生成邏輯電路,基于作為訓練數據的所述合成字符訓練圖像集合來訓練字符分類模型;
從PID可搜索數據庫中獲得包括字符模式的PID圖像,所述字符包括一個或多個輪廓;
將字符分類模型應用于PID圖像中的輪廓;
基于輪廓的位置信息將輪廓聚類為分層的組;
構造與輪廓的聚類對應的標記標簽;以及
在數據存儲庫中存儲標記標簽。
2.如權利要求1所述的方法,其中生成訓練數據包括:
創建感興趣的原型字符;
將感興趣的原型字符作為模板存儲在數據存儲庫中,以便以編程方式創建變化的訓練圖像;以及
使用原型字符創建多個隨機的變化的訓練數據。
3.如權利要求1所述的方法,其中字符分類模型包括機器學習算法。
4.如權利要求3所述的方法,其中機器學習算法包括卷積神經網絡、支持向量機、梯度提升決策樹或邏輯回歸模型。
5.如權利要求2所述的方法,其中生成訓練數據還包括修改感興趣的原型字符的大小、平移、旋轉或其它可能的變化。
6.如權利要求2所述的方法,其中生成訓練數據還包括將噪聲模式應用于一個或多個圖像。
7.如權利要求6所述的方法,其中應用噪聲模式包括:
選擇非字符背景;
生成隨機噪聲模式以創建噪聲背景;以及
在噪聲背景上放置變化的原型字符序列。
8.如權利要求2所述的方法,其中生成訓練數據還包括以組合方式隨機選擇原型字符包括在序列中,以支持N元文法類型的訓練數據。
9.如權利要求1所述的方法,其中構建字符分類模型包括將深度學習處理應用于訓練數據。
10.如權利要求1所述的方法,其中將字符分類模型應用于圖像以識別字符包括:對圖像進行分割以及對圖像應用啟發法,以抑制非字符輪廓并通過用字符分類模型對輪廓進行分類來識別字符輪廓。
11.一種用于對字符模式進行分類的系統,所述系統包括:
數據存儲庫和字符分類邏輯電路,所述字符分類邏輯電路包括處理器和其上嵌入有計算機可執行指令的非暫態計算機可讀介質,所述計算機可執行指令被配置為使所述處理器:
生成字符分類訓練數據;
基于字符分類訓練數據構建字符分類模型;
從數據存儲庫中獲得多個輪廓的圖像;
將字符分類模型應用于圖像,以通過基于字符分類模型對輪廓進行評分來確定輪廓是否為字符;
基于輪廓的位置將輪廓聚類為分層組;以及
從分類的輪廓的聚類中提取標簽。
12.如權利要求11所述的系統,其中所述計算機可執行指令被配置為使所述處理器:
創建感興趣的原型字符;
將感興趣的原型字符集合作為訓練圖像模板存儲在數據存儲庫中;以及
使用原型字符創建多個隨機的變化的訓練數據。
13.如權利要求12所述的系統,其中所述計算機可執行指令被配置為使所述處理器針對不同序列修改原型字符的大小、平移或旋轉。
14.如權利要求13所述的系統,其中所述計算機可執行指令被配置為使所述處理器將噪聲模式應用于一個或多個訓練圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于雪佛龍美國公司,未經雪佛龍美國公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880059456.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于校準毫米波天線陣列的方法
- 下一篇:訓練數據更新





