[發明專利]特征構建方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202010621785.X | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111753920B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 重慶紫光華山智安科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張欣欣 |
| 地址: | 400700 重慶市*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 構建 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種特征構建方法,其特征在于,所述方法包括:
獲取多個樣本,并將所述多個樣本劃分為特征構建集、訓練集及測試集,所述多個樣本是用于進行交通狀態預測模型的特征構建的歷史過車數據;
利用第一特征構建單元,對所述特征構建集中的所述樣本進行特征構建并記錄特征構建信息,得到多個第一集合;
利用第二特征構建單元計算每個所述第一集合的特征值;
生成特征映射表,其中,所述特征映射表包括多個預設類別、所述多個第一集合和每個所述第一集合的特征值,一個所述預設類別和一個所述第一集合確定一個所述特征值,所述多個預設類別包括城市快速路、支路和社區道路;
利用所述第一特征構建單元和所述特征構建信息,分別對所述訓練集和所述測試集中的所述樣本進行特征構建,得到多個第二集合和多個第三集合,所述多個第二集合和所述多個第一集合一一對應,所述多個第三集合和所述多個第一集合一一對應;
依據所述多個預設類別查找所述特征映射表,獲得每個所述第二集合的特征值和每個所述第三集合的特征值;
利用每個所述第二集合的特征值和每個所述第三集合的特征值,對預先選定的交通狀態預測模型進行訓練和測試,以迭代修改所述第一特征構建單元和所述第二特征構建單元的超參數,直至所述第一特征構建單元和所述第二特征構建單元達到最優;
所述第一特征構建單元包括預設指標,所述特征構建信息包括異常信息及分集信息;當應用于交通擁堵情況預測時,所述預設指標包括上游平均速度、上游流量、下游平均速度及下游流量;
所述利用第一特征構建單元,對所述特征構建集中的所述樣本進行特征構建并記錄特征構建信息,得到多個第一集合的步驟,包括:
獲取所述特征構建集中的任意一個目標樣本;
依據所述上游平均速度、所述上游流量、所述下游平均速度及所述下游流量,利用預設公式:
生成目標樣本對應的第一中間指標,其中,m表示路段標識,Vm1表示路段m的上游平均速度,Vm0表示路段m的下游平均速度,Qm1表示路段m的上游流量,Qm0表示路段m的下游流量,α表示所述第一特征構建單元的超參數,且α∈(0,1];
重復執行上述步驟,直至生成所述特征構建集中的每個所述樣本對應的第一中間指標,得到第一指標分布,所述第一指標分布包括每個所述樣本對應的第一中間指標;
對所述第一指標分布進行異常值處理并記錄所述異常信息,得到第一目標指標分布,所述第一目標指標分布包括每個所述樣本對應的第一目標指標數據;
對所述第一目標指標分布進行分集處理并記錄所述分集信息,得到所述多個第一集合,每個所述第一集合均包括至少一個所述第一目標指標數據。
2.如權利要求1所述的方法,其特征在于,當所述第一指標分布為連續變量時,所述異常信息包括所述第一目標指標分布的最大值和最小值,所述分集信息包括所述第一目標指標分布的分箱點信息;
所述對所述第一指標分布進行異常值處理并記錄所述異常信息,得到第一目標指標分布的步驟,包括:
對所述第一指標分布進行截斷處理得到所述第一目標指標分布,并記錄所述第一目標指標分布的最大值和最小值;
所述對所述第一目標指標分布進行分集處理并記錄所述分集信息,得到所述多個第一集合的步驟,包括:
按照預設分箱數對所述第一目標指標分布進行分箱處理,得到所述第一集合,并記錄所述第一目標指標分布的分箱點信息,所述預設分箱數為所述第一特征構建單元的超參數。
3.如權利要求1所述的方法,其特征在于,當所述第一指標分布為類別變量時,所述異常信息包括所述第一目標指標分布的替換前類別和替換后類別,所述分集信息包括所述第一目標指標分布的類別合并信息;
所述對所述第一指標分布進行異常值處理并記錄所述異常信息,得到第一目標指標分布的步驟,包括:
對所述第一指標分布進行類別替換處理得到所述第一目標指標分布,并記錄所述第一目標指標分布的替換前類別和替換后類別;
所述對所述第一目標指標分布進行分集處理并記錄所述分集信息,得到所述多個第一集合的步驟,包括:
對所述第一目標指標分布進行類別合并處理,得到所述多個第一集合,并記錄所述第一目標指標分布的類別合并信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶紫光華山智安科技有限公司,未經重慶紫光華山智安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010621785.X/1.html,轉載請聲明來源鉆瓜專利網。





