[發(fā)明專利]一種對(duì)評(píng)估對(duì)象的聚類方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201911055761.6 | 申請(qǐng)日: | 2019-10-31 |
| 公開(公告)號(hào): | CN110866549A | 公開(公告)日: | 2020-03-06 |
| 發(fā)明(設(shè)計(jì))人: | 張荃迪;徐為愷;楊楊;江旻 | 申請(qǐng)(專利權(quán))人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06Q40/00 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 王春波 |
| 地址: | 518027 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 評(píng)估 對(duì)象 方法 裝置 | ||
本發(fā)明涉及金融科技(Fintech)領(lǐng)域,并公開了一種對(duì)評(píng)估對(duì)象的聚類方法及裝置,根據(jù)各評(píng)估對(duì)象的屬性信息構(gòu)建對(duì)應(yīng)的各樣本點(diǎn);確定任一樣本點(diǎn)所屬聚類簇的方法:確定樣本點(diǎn)鄰域內(nèi)的樣本點(diǎn)數(shù);若鄰域內(nèi)的樣本點(diǎn)數(shù)滿足聚類點(diǎn)要求:鄰域內(nèi)的樣本點(diǎn)數(shù)不小于預(yù)設(shè)閾值,或鄰域內(nèi)的樣本點(diǎn)數(shù)大于樣本點(diǎn)所屬聚類簇中的樣本點(diǎn)數(shù);鄰域?yàn)橐詷颖军c(diǎn)為基準(zhǔn)的設(shè)定區(qū)域范圍;根據(jù)各聚類簇中的樣本點(diǎn)的數(shù)量,確定各聚類簇為正常樣本點(diǎn)所在的簇或異常樣本點(diǎn)所在的簇。該方案通過構(gòu)建各評(píng)估對(duì)象對(duì)應(yīng)的各樣本點(diǎn),確定各樣本點(diǎn)所屬的聚類簇,依據(jù)所形成各聚類簇中的樣本點(diǎn)的數(shù)量,有助于確定各評(píng)估對(duì)象的歸屬,即各評(píng)估對(duì)象為正常數(shù)據(jù)或者為異常數(shù)據(jù)。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及金融科技(Fintech)領(lǐng)域,尤其涉及一種對(duì)評(píng)估對(duì)象的聚類方法及裝置。
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,越來越多的技術(shù)(例如:區(qū)塊鏈、云計(jì)算或大數(shù)據(jù))應(yīng)用在金融領(lǐng)域,傳統(tǒng)金融業(yè)正在逐步向金融科技轉(zhuǎn)變,大數(shù)據(jù)技術(shù)也不例外。但由于金融、支付行業(yè)的安全性、實(shí)時(shí)性要求,也對(duì)大數(shù)據(jù)技術(shù)提出了更高的要求。
比如,金融領(lǐng)域可以將大數(shù)據(jù)技術(shù)用于審查客戶的貿(mào)易背景。針對(duì)運(yùn)輸、物流行業(yè)的客戶所提出的貸款請(qǐng)求,銀行需要對(duì)其進(jìn)行貿(mào)易背景審查,通過了貿(mào)易背景審查的客戶即能獲得銀行的放款。一般而言,貿(mào)易背景審查可以涉及對(duì)運(yùn)輸路線數(shù)據(jù)的分析,銀行可以要求客戶提供關(guān)于某一固定運(yùn)輸路線的全部行車記錄信息。然而,客戶反饋給銀行的關(guān)于這一固定路線的全部行車記錄信息中的絕大部分?jǐn)?shù)據(jù)是真實(shí)的,但仍存在少量數(shù)據(jù)是虛假的行車記錄,即異常的行車記錄。銀行需要對(duì)客戶提供的關(guān)于某一固定路線的全部行車記錄進(jìn)行分析。
現(xiàn)有技術(shù)在解決上述問題時(shí),采用了特征均值的方法。通過計(jì)算全部行車記錄的特征均值,然后將每次的行車記錄與特征均值進(jìn)行比對(duì):若每次的行車記錄與特征均值相差不大,則認(rèn)為此次的行車記錄是真實(shí)的行車記錄;若每次的行車記錄與特征均值相差很大,則認(rèn)為此次的行車記錄是異常的行車記錄。然而,對(duì)于真實(shí)的行車記錄與特征均值相差很大以及異常的行車的記錄與特征均值相差不大的情況,這種特征均值的方法則無法準(zhǔn)確地歸類出真實(shí)的行車記錄和異常的行車記錄。
發(fā)明內(nèi)容
本發(fā)明提供一種對(duì)評(píng)估對(duì)象的聚類方法及裝置,用以解決現(xiàn)有技術(shù)無法準(zhǔn)確識(shí)別出正常數(shù)據(jù)與異常數(shù)據(jù)。
第一方面,本發(fā)明實(shí)施例提供一種對(duì)評(píng)估對(duì)象的聚類方法,該方法包括:根據(jù)各評(píng)估對(duì)象的屬性信息,構(gòu)建所述各評(píng)估對(duì)象對(duì)應(yīng)的各樣本點(diǎn);確定各樣本點(diǎn)所屬的聚類簇;其中,針對(duì)任一樣本點(diǎn)通過如下方式確定所屬的聚類簇:確定所述樣本點(diǎn)的鄰域內(nèi)的樣本點(diǎn)數(shù);若所述鄰域內(nèi)的樣本點(diǎn)數(shù)滿足聚類點(diǎn)要求,則將所述樣本點(diǎn)所屬的聚類簇確定為所述鄰域內(nèi)的樣本點(diǎn)所屬的聚類簇;所述鄰域?yàn)橐运鰳颖军c(diǎn)為基準(zhǔn)的設(shè)定區(qū)域范圍;所述聚類點(diǎn)要求為所述鄰域內(nèi)的樣本點(diǎn)數(shù)不小于預(yù)設(shè)閾值,或所述鄰域內(nèi)的樣本點(diǎn)數(shù)大于所述樣本點(diǎn)所屬的聚類簇中的樣本點(diǎn)數(shù);根據(jù)各聚類簇中的樣本點(diǎn)的數(shù)量,確定各聚類簇為正常樣本點(diǎn)所在的簇或異常樣本點(diǎn)所在的簇。
基于該方案,通過構(gòu)建各評(píng)估對(duì)象對(duì)應(yīng)的各樣本點(diǎn),進(jìn)行通過聚類點(diǎn)要求確定各樣本點(diǎn)所屬的聚類簇;同時(shí),聚類點(diǎn)要求包括對(duì)鄰域內(nèi)的樣本點(diǎn)數(shù)和預(yù)設(shè)閾值的關(guān)系,以及,所述鄰域內(nèi)的樣本點(diǎn)數(shù)與所述樣本點(diǎn)所屬的聚類簇中的樣本點(diǎn)數(shù)的關(guān)系進(jìn)行判斷,從多個(gè)判斷依據(jù)來確定樣本點(diǎn)所屬的聚類簇中,有助于確定各評(píng)估對(duì)象的歸屬;最后通過各聚類簇中的樣本點(diǎn)的數(shù)量確定各評(píng)估對(duì)象為正常數(shù)據(jù)或者為異常數(shù)據(jù)。
在一種可能的實(shí)現(xiàn)方法中,若所述樣本點(diǎn)當(dāng)前無所屬的聚類簇,則將所述鄰域內(nèi)的樣本點(diǎn)作為一個(gè)聚類簇;或若所述鄰域內(nèi)的樣本點(diǎn)數(shù)小于所述預(yù)設(shè)閾值,且所述鄰域內(nèi)的樣本點(diǎn)數(shù)不大于所述樣本點(diǎn)所屬的聚類簇中的樣本點(diǎn)數(shù),則在所述樣本點(diǎn)所屬的聚類簇中選取下一個(gè)樣本點(diǎn)進(jìn)行是否為滿足聚類點(diǎn)要求的判斷,直至所述樣本點(diǎn)所屬的聚類簇中任一樣本點(diǎn)均已完成是否為聚類點(diǎn)的判斷。
上述實(shí)現(xiàn)方式,對(duì)于當(dāng)前無所屬的聚類簇的樣本點(diǎn)進(jìn)行了進(jìn)一步的歸類,同時(shí),對(duì)聚類簇中的樣本點(diǎn)實(shí)現(xiàn)了循環(huán)判斷,使得整個(gè)聚類過程更加快捷。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司,未經(jīng)深圳前海微眾銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911055761.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 生成評(píng)估方案的方法及裝置
- 一種基于PDCA環(huán)的評(píng)估方法及裝置
- 金融產(chǎn)品評(píng)估系統(tǒng)及方法
- 一種軍事演習(xí)演練量化評(píng)估系統(tǒng)
- 一種通過聲音進(jìn)行質(zhì)量評(píng)估的方法及裝置
- 一種項(xiàng)目評(píng)估方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種品性循環(huán)評(píng)估方法
- 基于組件的評(píng)估模型裝配方法及系統(tǒng)
- 一種綜合評(píng)估的方法和系統(tǒng)
- 產(chǎn)品的質(zhì)量評(píng)估方法及裝置
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫(kù)中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





