[發(fā)明專利]融合多維相似度與規(guī)則集合的地址模糊匹配方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202011395883.2 | 申請(qǐng)日: | 2020-12-03 |
| 公開(公告)號(hào): | CN112581252A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉志斌;施明強(qiáng);方俊煒;劉日佳 | 申請(qǐng)(專利權(quán))人: | 信用生活(廣州)智能科技有限公司 |
| 主分類號(hào): | G06Q40/02 | 分類號(hào): | G06Q40/02;G06F16/2458;G06F16/29;G06K9/62 |
| 代理公司: | 廣東高端專利代理事務(wù)所(特殊普通合伙) 44346 | 代理人: | 劉廣新 |
| 地址: | 510000 廣東省廣州市海珠區(qū)宸悅*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融合 多維 相似 規(guī)則 集合 地址 模糊 匹配 方法 系統(tǒng) | ||
本發(fā)明實(shí)施例涉及風(fēng)險(xiǎn)管控技術(shù)領(lǐng)域,公開了一種融合多維相似度與規(guī)則集合的地址模糊匹配方法及系統(tǒng),該方法包括:基于標(biāo)準(zhǔn)地址庫(kù)預(yù)處理標(biāo)準(zhǔn)地址得到待匹配信息,提取待匹配信息的地址特征,基于待匹配信息及地址特征,采用相似度計(jì)算模型計(jì)算第一相似度,以及,采用比對(duì)規(guī)則集合計(jì)算第二相似度,采用第二相似度調(diào)整第一相似度得到標(biāo)準(zhǔn)地址相對(duì)待匹配地址的總體相似度。本發(fā)明實(shí)施例采用比對(duì)規(guī)則集合配合相似度計(jì)算模型對(duì)標(biāo)準(zhǔn)地址進(jìn)行地址模糊匹配,通過標(biāo)準(zhǔn)地址庫(kù)自更新與相似度計(jì)算模型增量訓(xùn)練,解決對(duì)偏僻地址及未錄入地址的模糊匹配問題;比對(duì)規(guī)則集合根據(jù)增量訓(xùn)練結(jié)果同步更新,無需人工迭代,提高了迭代效率,從而降低了系統(tǒng)維護(hù)成本。
技術(shù)領(lǐng)域
本發(fā)明涉及風(fēng)險(xiǎn)管控技術(shù)領(lǐng)域,尤其涉及一種融合多維相似度與規(guī)則集合的地址模糊匹配方法及系統(tǒng)。
背景技術(shù)
在金融、信貸等領(lǐng)域存在形形色色的欺詐行為,其中涉及地址信息的欺詐較為常見。以信用卡申請(qǐng)為例,客戶在申請(qǐng)信用卡時(shí)需填寫其家庭住址、單位名稱、單位地址及卡寄地址等,部分客戶為了申請(qǐng)到大額信用卡,會(huì)尋找中介機(jī)構(gòu)為其包裝個(gè)人信息,通過填寫不實(shí)的公司信息、填寫不實(shí)的卡寄地址、在地址中添加特殊字符(拼音字符、繁體字、錯(cuò)別字等)以及填寫中介公司的聯(lián)系電話應(yīng)對(duì)來電審查,從而對(duì)抗銀行風(fēng)險(xiǎn)控制規(guī)則,達(dá)到欺詐目的。
現(xiàn)有的反欺詐審查手段主要采用基于匹配規(guī)則和標(biāo)椎地址庫(kù)的地址模糊匹配方法,首先錄入地址字符串與標(biāo)準(zhǔn)地址庫(kù),查詢與分割地址字符串中的行政區(qū)劃部分來過濾并縮小候選數(shù)據(jù)集,然后基于規(guī)則樹與規(guī)則庫(kù)進(jìn)行匹配來處理地址字符串中地址要素殘缺、地址歧義等問題,實(shí)現(xiàn)地址字符串的分詞與匹配,從而得到滿足要求的模糊匹配結(jié)果。
然而,上述模糊匹配方法存在以下問題,標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)在現(xiàn)實(shí)中無法對(duì)所有地址進(jìn)行存儲(chǔ),在面對(duì)偏僻地址及未收錄地址時(shí)匹配效果很差;此外,基于規(guī)則樹與規(guī)則庫(kù)的匹配方法,需要采用人工長(zhǎng)期對(duì)匹配規(guī)則進(jìn)行手動(dòng)迭代以提升匹配效果,因而存在迭代周期長(zhǎng)、迭代效率低下及系統(tǒng)維護(hù)成本高昂的缺點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例公開一種融合多維相似度與規(guī)則集合的地址模糊匹配方法及系統(tǒng),以相似度計(jì)算模型為主,配合采用比對(duì)規(guī)則集合,對(duì)標(biāo)準(zhǔn)地址與待匹配地址進(jìn)行地址模糊匹配,得到更為準(zhǔn)確的地址相似度;通過標(biāo)準(zhǔn)地址庫(kù)的自更新與相似度計(jì)算模型的增量訓(xùn)練,解決了難以對(duì)偏僻地址及未錄入地址進(jìn)行模糊匹配的問題;此外,比對(duì)規(guī)則集合根據(jù)相似度計(jì)算模型的增量訓(xùn)練結(jié)果進(jìn)行同步更新,無需人工介入進(jìn)行手動(dòng)迭代,即可實(shí)時(shí)更新比對(duì)規(guī)則,提高了迭代效率,縮短了迭代周期,從而降低了系統(tǒng)維護(hù)成本。
本發(fā)明實(shí)施例第一方面公開一種融合多維相似度與規(guī)則集合的地址模糊匹配方法,所述方法包括:
基于標(biāo)準(zhǔn)地址庫(kù)對(duì)標(biāo)準(zhǔn)地址進(jìn)行預(yù)處理,得到待匹配信息;其中,所述待匹配信息包括所述標(biāo)準(zhǔn)地址、對(duì)應(yīng)于所述標(biāo)準(zhǔn)的地址詳細(xì)信息及待匹配地址;
提取所述待匹配信息的地址特征;
基于所述待匹配信息及所述地址特征,采用相似度計(jì)算模型計(jì)算所述標(biāo)準(zhǔn)地址與所述待匹配地址的第一相似度;
基于所述待匹配信息及所述地址特征,采用比對(duì)規(guī)則集合計(jì)算所述標(biāo)準(zhǔn)地址與所述待匹配地址的第二相似度;
采用所述第二相似度調(diào)整所述第一相似度,得到所述標(biāo)準(zhǔn)地址相對(duì)所述待匹配地址的總體相似度。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述基于標(biāo)準(zhǔn)地址庫(kù)對(duì)標(biāo)準(zhǔn)地址進(jìn)行預(yù)處理,得到待匹配信息,包括:
提取所述標(biāo)準(zhǔn)地址中存在的地址層級(jí)字符及對(duì)應(yīng)于所述地址層級(jí)字符的地址名稱字符,作為所述標(biāo)準(zhǔn)地址對(duì)應(yīng)的地址詳細(xì)信息;
基于所述地址詳細(xì)信息中包括的地址層級(jí)字符與對(duì)應(yīng)的地址名稱字符,采用倒排索引在所述標(biāo)準(zhǔn)地址庫(kù)中檢索與所述標(biāo)準(zhǔn)地址近似度最高的待匹配地址;
整合所述標(biāo)準(zhǔn)地址、所述地址詳細(xì)信息及所述待匹配地址,作為所述待匹配信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于信用生活(廣州)智能科技有限公司,未經(jīng)信用生活(廣州)智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011395883.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金
- 多維、多元生命水及其用途
- 一種多維地址域名解析的方法和裝置以及系統(tǒng)
- 創(chuàng)建多維操作系統(tǒng)的方法和裝置
- 一種對(duì)多維地址數(shù)據(jù)進(jìn)行解析的方法和裝置以及系統(tǒng)
- 一種分組的交付和路由選擇的方法和裝置以及系統(tǒng)
- 多維碼處理方法、發(fā)送端、接收端和系統(tǒng)
- 多維度信息展示方法及裝置
- 一種屏幕可視化方法、裝置、電子設(shè)備及介質(zhì)
- 多維數(shù)據(jù)集的生成方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)
- 規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置
- 不規(guī)則瓶蓋
- 相關(guān)規(guī)則分析裝置以及相關(guān)規(guī)則分析方法
- 分析規(guī)則調(diào)整裝置、分析規(guī)則調(diào)整系統(tǒng)以及分析規(guī)則調(diào)整方法
- 規(guī)則抽取方法和規(guī)則抽取設(shè)備
- 終端規(guī)則引擎裝置、終端規(guī)則運(yùn)行方法
- 布(規(guī)則)
- 規(guī)則呈現(xiàn)方法、存儲(chǔ)介質(zhì)和規(guī)則呈現(xiàn)裝置
- 可編寫規(guī)則配置模塊、規(guī)則生成系統(tǒng)、及規(guī)則管理平臺(tái)
- 不規(guī)則圍棋





