[發(fā)明專利]確定企業(yè)屬性相似性、重名對(duì)象判定在審
| 申請(qǐng)?zhí)枺?/td> | 202011336327.8 | 申請(qǐng)日: | 2020-11-25 |
| 公開(公告)號(hào): | CN112417879A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計(jì))人: | 蘇國(guó)輝 | 申請(qǐng)(專利權(quán))人: | 上海水滴征信服務(wù)有限公司 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06K9/62;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 中國(guó)專利代理(香港)有限公司 72001 | 代理人: | 施能佳;姜冰 |
| 地址: | 201206 上海市浦東新區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 確定 企業(yè) 屬性 相似性 重名 對(duì)象 判定 | ||
1.一種確定企業(yè)屬性相似性的方法,包括:
根據(jù)兩個(gè)企業(yè)的名稱確定名稱相似性;
根據(jù)兩個(gè)企業(yè)的地址確定地址相似性;
根據(jù)兩個(gè)企業(yè)的注冊(cè)資金確定注冊(cè)資金相似性;
根據(jù)兩個(gè)企業(yè)關(guān)聯(lián)的人名確定人名相似性;以及
利用分類器根據(jù)所述名稱相似性、所述地址相似性、所述注冊(cè)資金相似性、所述人名相似性來(lái)確定企業(yè)屬性相似性。
2.根據(jù)權(quán)利要求1所述的方法,根據(jù)所述名稱中相同字符的數(shù)量、所述相同字符在較短名稱中的位置以及所述名稱的長(zhǎng)度確定所述名稱相似性。
3.根據(jù)權(quán)利要求2所述的方法,通過(guò)下式計(jì)算所述名稱相似性:
其中,simname表示所述名稱相似性,k表示所述相同字符的數(shù)量,i表示所述相同字符在較短名稱中的位置編碼,length1和length2表示企業(yè)名稱的長(zhǎng)度。
4.根據(jù)權(quán)利要求1所述的方法,根據(jù)所述地址中的行政區(qū)劃層級(jí)的歸屬確定所述地址相似性。
5.根據(jù)權(quán)利要求4所述的方法,通過(guò)下式計(jì)算所述地址相似性:
其中,simaddress表示所述地址相似性,A、B和C為大于0的系數(shù);以及
若所述地址同省則x為1,否則為0;若所述地址同市則y為1,否則為0;若所述地址同區(qū)則z為1,否則為0。
6.根據(jù)權(quán)利要求5所述的方法,其中A<B且B<C。
7.根據(jù)權(quán)利要求1所述的方法,通過(guò)下式計(jì)算所述注冊(cè)資金相似性:
其中,simregistered_capital表示所述注冊(cè)資金相似性,r1、r2分別表示兩個(gè)企業(yè)的所述注冊(cè)資金;以及
若所述注冊(cè)資金單位相同則m為1,否則為-1。
8.根據(jù)權(quán)利要求1所述的方法,根據(jù)所述關(guān)聯(lián)的人名中重名對(duì)象的數(shù)量,以及與所述重名對(duì)象所關(guān)聯(lián)的全部企業(yè)數(shù)量確定所述人名相似性。
9.根據(jù)權(quán)利要求8所述的方法,通過(guò)下式計(jì)算所述人名相似性:
其中,simpname表示所述人名相似性,n表示所述重名對(duì)象的數(shù)量,numi表示第i個(gè)重名對(duì)象所關(guān)聯(lián)的全部企業(yè)數(shù)量。
10.根據(jù)權(quán)利要求1所述的方法,若兩個(gè)企業(yè)中任意一者缺少名稱、地址、注冊(cè)資金、關(guān)聯(lián)的人名的信息,則對(duì)應(yīng)的名稱相似性、地址相似性、注冊(cè)資金相似性、人名相似性置為預(yù)定值。
11.根據(jù)權(quán)利要求1所述的方法,所述分類器為梯度提升樹或者神經(jīng)網(wǎng)絡(luò)。
12.根據(jù)權(quán)利要求1所述的方法,所述企業(yè)屬性相似性為概率值,若所述企業(yè)屬性相似性大于預(yù)定值則判定兩個(gè)企業(yè)相似,反之不相似。
13.一種訓(xùn)練分類器的方法,該方法基于已知其企業(yè)屬性相似性的兩個(gè)企業(yè),包括:
根據(jù)兩個(gè)企業(yè)的名稱確定名稱相似性;
根據(jù)兩個(gè)企業(yè)的地址確定地址相似性;
根據(jù)兩個(gè)企業(yè)的注冊(cè)資金確定注冊(cè)資金相似性;
根據(jù)兩個(gè)企業(yè)關(guān)聯(lián)的人名確定人名相似性;以及
以所述名稱相似性、所述地址相似性、所述注冊(cè)資金相似性、所述人名相似性為輸入,以所述企業(yè)屬性相似性為輸出訓(xùn)練所述分類器。
14.一種判斷兩個(gè)企業(yè)的重名對(duì)象是否相同的方法,包括:
根據(jù)權(quán)利要求1-12中任一項(xiàng)所述的方法確定企業(yè)屬性相似性;以及
若判斷兩個(gè)企業(yè)相似則重名對(duì)象相同,否則不同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海水滴征信服務(wù)有限公司,未經(jīng)上海水滴征信服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011336327.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)企業(yè)規(guī)劃模型進(jìn)行水平企業(yè)規(guī)劃
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)評(píng)價(jià)裝置和企業(yè)評(píng)價(jià)程序
- 企業(yè)與企業(yè)之間信息交流平臺(tái)
- 基于企業(yè)畫像的企業(yè)精準(zhǔn)分析方法
- 標(biāo)貼(企業(yè))
- 基于異類關(guān)系確定目標(biāo)相似性的方法和系統(tǒng)
- 相似性匹配系統(tǒng)和方法
- 相似性匹配系統(tǒng)和方法
- 興趣點(diǎn)預(yù)測(cè)和推薦中的用戶時(shí)空相似性度量方法
- 一種基于相似性和邏輯矩陣分解的miRNA?疾病關(guān)聯(lián)關(guān)系預(yù)測(cè)方法
- 一種結(jié)合二分網(wǎng)絡(luò)和文本的醫(yī)院科室相似性分析方法
- 一種基于相似性學(xué)習(xí)及其增強(qiáng)的細(xì)胞類型鑒定方法
- 確定企業(yè)屬性相似性、重名對(duì)象判定
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的lncRNA-蛋白質(zhì)相互作用預(yù)測(cè)方法





