[發明專利]特征抽取方法、機器學習方法及其裝置有效
| 申請號: | 201610011587.5 | 申請日: | 2016-01-08 |
| 公開(公告)號: | CN105677353A | 公開(公告)日: | 2016-06-15 |
| 發明(設計)人: | 白楊;陳雨強 | 申請(專利權)人: | 北京物思創想科技有限公司 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44;G06F17/24 |
| 代理公司: | 北京睿邦知識產權代理事務所(普通合伙) 11481 | 代理人: | 張麗新 |
| 地址: | 100090 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 抽取 方法 機器 學習方法 及其 裝置 | ||
1.一種針對數據記錄進行特征抽取的方法,包括:
數據記錄獲取步驟,獲取數據記錄;
特征抽取配置項獲取步驟,獲取用于限定如何從所述數據記錄抽取預定 特征的特征抽取配置項,其中,每種預定特征的特征抽取配置項包括來源字 段項和處理方法項,來源字段項用于將所述每種預定特征所涉及的數據記錄 的字段限定為來源字段,處理方法項用于指定對預先編程為可執行代碼的數 據處理函數的引用,其中,所述數據處理函數用于針對由來源字段項限定的 來源字段的字段值執行用于抽取所述每種預定特征的數據處理;以及
特征值獲取步驟,基于特征抽取配置項對所述數據記錄的字段值執行數 據處理以獲取所述預定特征的特征值。
2.根據權利要求1所述的方法,其中,所述特征抽取配置項獲取步驟包 括:從設置了特征抽取配置項的配置文件讀取特征抽取配置項或根據用戶的 輸入操作來獲取特征抽取配置項,其中,配置文件被存儲在本地或遠程接收。
3.根據權利要求1所述的方法,其中,所述特征抽取配置項獲取步驟包 括:
向用戶顯示用于設置特征抽取配置項的界面;
根據用戶在所述界面上執行的輸入操作來生成設置了特征抽取配置項的 配置文件;以及
從生成的配置文件中讀取特征抽取配置項。
4.根據權利要求3所述的方法,其中,用于設置特征抽取配置項的界面 為圖形用戶界面,所述圖形用戶界面包括用于手動編輯配置文件的文本編輯 界面和/或用于顯示特征抽取配置項的內容選項以供手動選擇的選擇輸入型 界面。
5.根據權利要求4所述的方法,其中,在所述特征抽取配置項獲取步驟 中,響應于用戶的界面切換操作輸入在文本編輯界面和選擇輸入型界面之間 切換,在切換前界面下的特征抽取配置項設置結果被同步地顯示到切換后的 界面下。
6.根據權利要求1-5中的任一權利要求所述的方法,其中,所述每種預 定特征的特征抽取配置項還包括存儲位置標識,用于指示與所述每種預定特 征的特征值相應的計算系數在存儲器中的存儲區域。
7.一種計算機執行的機器學習方法,包括:
數據記錄獲取步驟,獲取數據記錄;
特征抽取配置項獲取步驟,獲取用于限定如何從所述數據記錄抽取預定 特征的特征抽取配置項,其中,每種預定特征的特征抽取配置項包括來源字 段項和處理方法項,來源字段項用于將所述每種預定特征所涉及的數據記錄 的字段限定為來源字段,處理方法項用于指定對預先編程為可執行代碼的數 據處理函數的引用,其中,所述數據處理函數用于針對由來源字段項限定的 來源字段的字段值執行用于抽取所述每種預定特征的數據處理;
特征值獲取步驟,基于特征抽取配置項對所述數據記錄的字段值執行數 據處理以獲取所述預定特征的特征值;
樣本獲得步驟,至少部分基于所述特征值獲取步驟獲取的特征值,形成 特征向量,作為機器學習的樣本;以及
機器學習步驟,基于所述樣本進行機器學習。
8.一種針對數據記錄進行特征抽取的計算裝置,包括存儲部件和處理器, 存儲部件中存儲有計算機可執行指令集合,當所述計算機可執行指令集合被 所述處理器執行時,執行下述步驟:
數據記錄獲取步驟,獲取數據記錄;
特征抽取配置項獲取步驟,獲取用于限定如何從所述數據記錄抽取預定 特征的特征抽取配置項,其中,每種預定特征的特征抽取配置項包括來源字 段項和處理方法項,來源字段項用于將所述每種預定特征所涉及的數據記錄 的字段限定為來源字段,處理方法項用于指定對預先編程為可執行代碼的數 據處理函數的引用,其中,所述數據處理函數用于針對由來源字段項限定的 來源字段的字段值執行用于抽取所述每種預定特征的數據處理;以及
特征值獲取步驟,基于特征抽取配置項對所述數據記錄的字段值執行數 據處理以獲取所述預定特征的特征值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京物思創想科技有限公司,未經北京物思創想科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610011587.5/1.html,轉載請聲明來源鉆瓜專利網。





