[發明專利]一種公司名稱匹配方法、裝置、終端設備及存儲介質在審
| 申請號: | 201911329375.1 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN110889467A | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 顏果開 | 申請(專利權)人: | 中國建設銀行股份有限公司;建信金融科技有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 公司名稱 匹配 方法 裝置 終端設備 存儲 介質 | ||
本發明公開了一種公司名稱匹配方法、裝置、終端設備及存儲介質。所述方法包括:確定公司名稱集合中各公司名稱間的相似度;從所述公司名稱集合中提取相似度大于對應的閾值的公司名稱,得到第一集合;基于所述第一集合中各公司名稱的地址相似度,確定所述第一集合中相互匹配的公司名稱。利用該方法,能夠提高公司名稱匹配的精確度。
技術領域
本發明實施例涉及數據處理技術領域,尤其涉及一種公司名稱匹配方法、裝置、終端設備及存儲介質。
背景技術
中國消費貸的市場不斷擴大,團伙欺詐的風險也越來越高。在對消費貸風險進行識別時,通常基于用戶的基本信息構建關系網絡,以挖掘快貸背景下的公司與人,人與人之間的隱藏關聯,從而發現異常群體、盡早識別集中性風險。
在確定隱藏關聯的過程中,公司名稱是網絡中比較關鍵的信息。但是由于用戶的基本信息(包括公司名稱、公司地址、聯系人和手機號)都是由用戶填寫,在用戶填寫公司名稱時存在大量的公司名稱不規范、與實際公司名稱不一致的情況,從而導致實際相同的公司名稱因填寫不規范而無法關聯。
發明內容
本發明實施例提供了一種公司名稱匹配方法、裝置、終端設備及存儲介質,以提高公司名稱匹配的精確度。
第一方面,本發明實施例提供了一種公司名稱匹配方法,包括:
確定公司名稱集合中各公司名稱間的相似度;
從所述公司名稱集合中提取相似度大于對應的閾值的公司名稱,得到第一集合;
基于所述第一集合中各公司名稱的地址相似度,確定所述第一集合中相互匹配的公司名稱。
進一步的,所述基于所述第一集合中各公司名稱的地址相似度,確定所述第一集合中相互匹配的公司名稱,包括:
確定所述第一集合中各公司名稱間的地址相似度;
將所述第一集合中地址相似度大于地址閾值的公司名稱,確定為所述第一集合中相互匹配的公司名稱。
進一步的,所述相似度包括名稱相似度和/或鄰居相似度。
進一步的,所述從所述公司名稱集合中提取相似度大于對應的閾值的公司名稱,得到第一集合,包括:
從所述公司名稱集合中提取名稱相似度大于對應的閾值的公司名稱,得到第二集合,所述名稱相似度對應的閾值為名稱閾值;
基于所述第二集合,得到第一集合。
進一步的,所述基于所述第二集合,得到第一集合,包括:
確定所述第二集合中各公司名稱間的鄰居相似度;
基于所述名稱相似度和所述鄰居相似度,確定綜合相似度;
從所述第二集合中提取所述綜合相似度大于對應的閾值的公司名稱,得到第一集合,所述綜合相似度大于對應的閾值為綜合閾值。
進一步的,所述基于所述第一集合中各公司名稱的地址相似度,確定所述第一集合中相互匹配的公司名稱,包括:
基于地址相似度和所述綜合相似度,確定目標相似度;
將所述第一集合中目標相似度大于目標閾值的公司名稱,確定為所述第一集合中相互匹配的公司名稱。
進一步的,所述公司名稱集合具有相同的關鍵字。
第二方面,本發明實施例還提供了一種公司名稱匹配裝置,包括:
第一確定模塊,用于確定公司名稱集合中各公司名稱間的相似度;
得到模塊,用于從所述公司名稱集合中提取相似度大于對應的閾值的公司名稱,得到第一集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司;建信金融科技有限責任公司,未經中國建設銀行股份有限公司;建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911329375.1/2.html,轉載請聲明來源鉆瓜專利網。





