[發明專利]識別重名人員的方法和裝置、存儲介質和電子設備在審
| 申請號: | 202210093296.0 | 申請日: | 2022-01-26 |
| 公開(公告)號: | CN114519077A | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 馬大蔚 | 申請(專利權)人: | 北京金堤科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 賈銀秋 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 重名 人員 方法 裝置 存儲 介質 電子設備 | ||
本發明實施例公開了一種識別重名人員的方法和裝置,以及存儲介質和電子設備,其方法包括:對于具有重名人員的兩個目標對象,分別獲取兩個目標對象的第一特征數據樣本和第二特征數據樣本,根據第一特征數據樣本確定多個第一特征的第一特征值;以及根據第二特征數據樣本確定多個第二特征的第二特征值;最后根據多個第一特征值和多個第二特征值確定的兩個目標對象的關聯度值與預設的關聯度閾值確定兩個目標對象的重名人員是否為同一個自然人。本發明實施例擴大了重名人員的識別范圍,并且通過對采集的特征數據進行過濾,計算多個第一特征和第二特征的特征值來綜合判斷兩個目標對象的關聯程度,提高了重名人員識別的準確性。
技術領域
本發明涉及數據分析技術領域,并且更具體地,涉及一種識別重名人員的方法和裝置、存儲介質和電子設備。
背景技術
在日常生活和各種商業活動中,人們經常需要查詢特定人員的信息,但由于不同自然人會出現名字相同的情況,因此,對于兩個目標對象中同名的自然人,確定是否是同一個自然人,在查詢過程中就成為用戶遇到的一個比較困擾的問題。
發明內容
本發明要解決的問題為對于具有重名人員的兩個目標對象,如何確定兩個目標對象中的重名人員是否為同一個自然人。為了解決現有技術中無法識別兩個目標對象中的重名人員是否為同一個自然人的技術問題,本發明的實施例提供一種識別重名人員的方法和裝置,以及存儲介質和電子設備。
根據本發明實施例的一個方面,提供了一種識別重名人員的方法,所述方法包括:
對于具有重名人員的兩個目標對象,分別獲取兩個目標對象的第一特征數據樣本和第二特征數據樣本,其中,第一特征數據樣本中包括多個第一特征,第二特征數據樣本中包括多個第二特征,第一特征是確定目標對象之間相關關系的特征,第二特征是確定目標對象之間相似關系的特征;
根據兩個目標對象的第一特征數據樣本確定多個第一特征的第一特征值;以及根據兩個目標對象的第二特征數據樣本確定多個第二特征的第二特征值;
根據多個第一特征值和多個第二特征值確定兩個目標對象的關聯度值;
根據所述關聯度值與預設的關聯度閾值確定兩個目標對象的重名人員是否為同一個自然人。
可選地,在本發明上述各方法實施例中,對于具有重名人員的兩個目標對象,分別獲取兩個目標對象的第一特征數據樣本和第二特征數據樣本,包括:
分別獲取兩個目標對象的初始第一特征數據和初始第二特征數據;
基于預先設置的第一特征黑名單,對初始第一特征數據中的擬過濾的第一特征的特征數據進行過濾,生成第一特征數據樣本;
基于預先設置的第二特征黑名單,對初始第二特征數據中的擬過濾的第二特征的特征數據進行過濾,生成第二特征數據樣本。
可選地,在本發明上述各方法實施例中,根據兩個目標對象的第一特征數據樣本確定多個第一特征的第一特征值包括:
將兩個目標對象的第一特征數據樣本中的每個第一特征的第一特征信息項進行匹配,當第一特征的第一特征信息項不匹配時,確認所述第一特征的特征值為0;當第一特征的第一特征信息項匹配時,根據所述第一特征的第一特征信息項對應的第一特征出現次數項和預設的第一特征出現次數閾值計算所述第一特征的第一特征值。
可選地,在本發明上述各方法實施例中,根據所述第一特征的第一特征信息項對應的第一特征出現次數項和預設的第一特征出現次數閾值計算所述第一特征的第一特征值的計算公式具體為:
r=(y-x)/y
式中,y是預設的第一特征出現次數閾值,x是第一特征出現次數項;r是第一特征的第一特征值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金堤科技有限公司,未經北京金堤科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210093296.0/2.html,轉載請聲明來源鉆瓜專利網。





