[發明專利]樣本聚類方法、裝置、設備及可讀存儲介質在審
| 申請號: | 202010090370.4 | 申請日: | 2020-02-13 |
| 公開(公告)號: | CN111339212A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 鞠策;高大山 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06N20/00 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 魏蘭 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 方法 裝置 設備 可讀 存儲 介質 | ||
本申請公開了一種樣本聚類方法、裝置、設備和可讀存儲介質,所述樣本聚類方法包括:接收待聚類數據,并對所述待聚類數據進行預處理,獲得各第一類型數據和各第二類型數據,對各所述第一類型數據和各所述第二類型數據進行聚類處理,獲得聚類樣本,基于所述聚類樣本,與所述第一設備關聯的各第二設備進行聯邦學習。本申請解決了樣本獲取效率低的技術問題。
技術領域
本申請涉及金融科技(Fintech)的人工智能技術領域,尤其涉及一種樣本聚類方法、裝置、設備及可讀存儲介質。
背景技術
隨著金融科技,尤其是互聯網科技金融的不斷發展,越來越多的技術(如分布式、區塊鏈Blockchain、人工智能等)應用在金融領域,但金融業也對技術提出了更高的要求,如對金融業對應待辦事項的分發也有更高的要求。
隨著計算機軟件和人工智能的不斷發展,人工智能的應用也越來越廣泛,在無人駕駛領域,許多基礎算法模塊均涉及到基于數據的人工智能技術,例如,無人車的感知模塊和路徑規劃模塊的部分技術等,進而利用該技術進行路測可收集訓練樣本用于進行無人車自動駕駛的訓練,但是,單個無人駕駛公司利用該方法收集的訓練樣本的數量往往是有限的,而不同的無人駕駛公司之間的訓練樣本往往是互相保密的,極大程度上影響了各無人車公司獲取訓練樣本的效率,且路測收集的訓練樣本往往存在過多的噪音,難以篩選出特征豐富度高的訓練樣本,進而導致各無人駕駛公司獲取樣本的效率更低,所以,現有技術中存在樣本獲取效率低的技術問題。
發明內容
本申請的主要目的在于提供一種樣本聚類方法、裝置、設備和可讀存儲介質,旨在解決現有技術中樣本獲取效率低的技術問題。
為實現上述目的,本申請提供一種樣本聚類方法,所述樣本聚類方法應用于第一設備,所述樣本聚類方法包括:
接收待聚類數據,并對所述待聚類數據進行預處理,獲得各第一類型數據和各第二類型數據;
對各所述第一類型數據和各所述第二類型數據進行聚類處理,獲得聚類樣本;
基于所述聚類樣本,與所述第一設備關聯的各第二設備進行聯邦學習。
可選地,各所述第一類型數據包括一個或多個的車輛動力學數據,各所述第二類型數據包括一個或者多個環境數據,
所述對各所述第一類型數據和各所述第二類型數據進行聚類處理,獲得聚類樣本的步驟包括:
對各所述車輛動力學數據進行聚類處理,獲得車輛動力學聚類數據,并從各所述車輛動力學聚類數據中選取第一類型樣本;
對各所述環境數據進行降維處理,獲得所述降維數據,并在所述降維數據中選取各所述第一類型樣本對應的待聚類降維數據;
對各所述待聚類降維數據進行聚類處理,獲得第二類型樣本,并從所述第一類型樣本和所述第二類型樣本中選取所述聚類樣本。
可選地,所述第一類型樣本包括一個或者多個第一類型時間片段數據,所述第二類型樣本包括一個或者多個第二類型時間片段數據,
所述從所述第一類型樣本和所述第二類型樣本中選取所述聚類樣本的步驟包括:
從各所述第一類型時間片段數據中選取預設數量的第一聚類數據,并獲取各所述第一聚類數據對應的時間片段;
基于各所述時間片段,在各所述第二類型時間片段數據中選取各所述第一聚類數據對應的第二聚類數據;
分別將各所述第一聚類數據和各所述第二聚類數據中所述片段相同的數據進行組合,獲得所述聚類樣本。
可選地,所述對各所述車輛動力學數據進行聚類處理,獲得車輛動力學聚類數據的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010090370.4/2.html,轉載請聲明來源鉆瓜專利網。





