[發明專利]一種自動化特征提取系統及方法在審
| 申請號: | 202010302592.8 | 申請日: | 2020-04-17 |
| 公開(公告)號: | CN111461253A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 王磊 | 申請(專利權)人: | 浙江百應科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州浙言專利代理事務所(普通合伙) 33370 | 代理人: | 易朝暉 |
| 地址: | 311121 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動化 特征 提取 系統 方法 | ||
本發明涉及一種自動化特征提取框架系統及方法,包括:信號輸入模塊:用于輸入字段信息;配置讀取模塊:用于定義字段類型和對應的映射業務,配置對應的字段和特征方法;預處理模塊:用于對輸入字段進行特征預處理;特征抽取模塊:用于對預處理后的數據進行特征抽取;信號輸出模塊:用于聯合抽取出的特征并統一輸出給模型;本發明提供一種基于工廠模式的自動化特征提取方法,在整個實現的過程中提供了一種多人協作共建特征提取類和相互交互復用的方法;本發明采用工廠模式和相關特征類的反射機制抽象了特征提取的各個模塊和方法,完全自動化特征提取,可以方便的通過配置進行特征的選擇和迭代。
技術領域
本發明涉及互聯網技術領域,具體涉及一種自動化特征提取框架系統及方法。
背景技術
隨著大數據和機器計算力的飛速發展,機器學習和深度學習越來越多的運用到解決實際問題的各個方面。
在專利公布號為CN108986168的發明專利中公開了一種,本發明公開一種基于深度度量學習結合詞袋樹模型的機器人回環檢測方法和裝置。該方法為:1 )輸入長時間的環境外觀變化的場景視頻流;2 )采用深度度量學習框架訓練并學習得到特征提取網絡;3 )利用特征提取網絡從訓練視頻流圖像中抽取特征;4 )對得到的特征進行迭代聚類,建立詞袋樹模型;5 )在實際機器人定位和導航過程中,輸入機器人實時獲取的視頻流中的當前關鍵幀;6 )利用特征提取網絡提取當前關鍵幀的特征;7 )將當前關鍵幀的特征添加到詞袋樹模型;8 )利用詞袋樹模型搜索和匹配圖像特征相近的圖像幀,并進行相似性度量,判斷機器人是否遇到回環。本發明能夠實現機器人在動態環境中長時間定位和導航過程中的高效的回環檢測。
在上述現有技術中,沒有提供一個完全自動化的實時特征提取框架,且基本各個環節都或多或少的需要人的參與,不能滿足多個人完全自然的積累特征抽取類,提供相關的實現方法,且每次迭代在特征抽取方法和具體的參數上不能復用。
發明內容
為了解決上述問題,本發明提供一種自動化特征提取框架系統及方法,采用工廠模式和相關特征類的反射機制抽象了特征提取的各個模塊和方法,完全自動化特征提取,可以方便的通過配置進行特征的選擇和迭代,算法多次迭代選擇特征訓練測試模型時,可以通過配置修改一鍵完成,避免出現多次選擇特征復用不夠的情況。
本發明的技術方案如下所示:
一種自動化特征提取框架系統,包括:
信號輸入模塊:用于輸入字段信息;
配置讀取模塊:用于定義字段類型和對應的映射業務,配置對應的字段和特征方法;
預處理模塊:用于對輸入字段進行特征預處理;
特征抽取模塊:用于對預處理后的數據進行特征抽取;
信號輸出模塊:用于聯合抽取出的特征并統一輸出給模型。
優選的,所述配置讀取模塊中抽象出的配置文件具體為fealib.conf和feature_list.conf。
優選的,所述配置文件fealib.conf用于定義上游日志中相關的字段類型和對應的映射業務;所述配置文件feature_list.conf用于配置對應的字段和特征方法。
優選的,經所述預處理模塊中處理過的特征,通過java反射的方式定義到具體的特征工程類。
優選的,所述特征抽取模塊中定義了對應好特征的slot槽位,能夠支持同一個字段提取多個特征或多個字段聯合生成同一個特征。
優選的,經所述特征抽取模塊抽取后的特征通過輸出接口聯合成統一的樣本instance輸出給模型。
本發明還提供一種自動化特征提取框架方法,包括以下步驟:
S1:通過信號輸入接口輸入字段信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江百應科技有限公司,未經浙江百應科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010302592.8/2.html,轉載請聲明來源鉆瓜專利網。





