[發明專利]分類預測方法、裝置和電子設備在審
| 申請號: | 202210873058.1 | 申請日: | 2022-07-21 |
| 公開(公告)號: | CN115099366A | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 陳德蕾;陳龍;陳樹華 | 申請(專利權)人: | 北京頂象技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q40/02;G06Q40/08;G06F16/901 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張萌 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 預測 方法 裝置 電子設備 | ||
本發明提供了一種分類預測方法、裝置和電子設備,在得到二分類模型的第一預測結果后,可基于初始樣本集合中樣本間的屬性關聯關系,構建包含多個節點的初始關聯關系網;之后基于第一預測結果為初始關聯關系網中每個節點所對應的樣本設置初始類別標簽以得到第一關聯關系網,并對第一關聯關系網進行社區劃分;根據社區劃分結果,以社區為單位對同一社區內節點所對應樣本的初始類別標簽進行更新,得到第二預測結果。采用本發明可以提高二分類模型預測結果的可靠性,從而降低相關業務部門產生損失的風險。
技術領域
本發明涉及計算機技術領域,尤其是涉及一種分類預測方法、裝置和電子設備。
背景技術
隨著計算機技術的發展,社會中一些工作已經由人工處理變成了機器處理。機器學習二分類模型便是其中具有代表性的技術,該技術已經被廣泛地應用到金融、保險等場景。以審核信用卡申請為例,可用二分類模型分析申請人的信用情況,從而判斷該申請人是否滿足信用卡申請的通過要求;但不同信用卡申請者可能有相近的住址或隸屬同一個單位,那么他們之間的信用情況是可能相互影響的,如果某一申請者有較高的欺詐違約的可能性,與之密切相關的申請者欺詐違約的可能性也會提高。以通過保險代理人購買保險為例,可用二分類模型分析保險代理人的信息,從而判定該保險代理人是否值得信賴,但如果多個代理人可通過增員、互保、掛單等行為對單個代理人的模型判定結果進行了優化,則該多個代理人中的每個代理人值得信賴的可能性也會降低。
然而,傳統的二分類模型所使用的特征通常不能表征出樣本之間的關聯關系,因而模型在分類預測時無法利用樣本間關聯關系所隱含的額外信息,從而導致其預測結果的可靠性較低,相關業務部門對該預測結果進行分析后所得出的結論很有可能是錯誤的,在未來有可能會給相關業務部門造成難以挽回的損失。
發明內容
有鑒于此,本發明的目的在于提供一種分類預測方法、裝置和電子設備,以提高二分類模型預測結果的可靠性,從而降低相關業務部門產生損失的風險。
第一方面,本發明實施例提供了一種分類預測方法,所述方法包括:利用目標場景對應的二分類模型對所述目標場景的初始樣本集合進行預測,得到第一預測結果;其中,所述目標場景為預先確定的待分類預測的場景,所述第一預測結果包括所述初始樣本集合中每個樣本的分類概率和/或分類分數;基于所述初始樣本集合中樣本間的屬性關聯關系,構建包含多個節點的初始關聯關系網;其中,所述初始關聯關系網中的每個節點與所述初始樣本集合中的每個樣本一一對應;所述初始關聯關系網中用節點間的連線表征所述初始樣本集合中樣本間的關聯關系,且每條連線均設置有表征樣本間關聯性大小的權重;基于所述第一預測結果為所述初始關聯關系網中每個節點所對應的樣本設置初始類別標簽,得到第一關聯關系網;基于所述第一預測結果和所述第一關聯關系網中每條連線的權重,對所述第一關聯關系網進行社區劃分,得到第一社區集合;其中,所述第一社區集合中的每個社區均包含至少兩個節點;對于所述第一社區集合中的每個社區,均根據該社區包含的所有節點的第一預測結果,對該社區中的節點所對應樣本的初始類別標簽進行更新,得到第二預測結果。
作為一種可能的實現,基于所述第一預測結果,為所述初始關聯關系網中每個節點所對應的樣本設置初始類別標簽,得到第一關聯關系網的步驟,包括:基于所述第一預測結果,確定所述初始樣本集合中每個樣本的分類分數;基于所述初始樣本集合中每個樣本的分類分數,確定所述初始關聯關系網中的種子節點;其中,所述種子節點對應樣本的分類分數小于第一分數閾值;將所述種子節點所對應樣本的初始類別標簽設置為表征正樣本的第一類標簽,將所述初始關聯關系網中所述種子節點以外的其他節點所對應樣本的初始類別標簽設置為表征負樣本的第二類標簽,得到所述第一關聯關系網。
作為一種可能的實現,基于所述第一預測結果,確定所述初始樣本集合中每個樣本的分類分數的步驟,包括:從所述第一預測結果中直接獲取所述初始樣本集合中每個樣本的分類概率;基于所述初始樣本集合中每個樣本的分類概率,確定所述初始樣本集合中每個樣本的分類分數;或者,從所述第一預測結果中直接獲取所述初始樣本集合中每個樣本的分類分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京頂象技術有限公司,未經北京頂象技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210873058.1/2.html,轉載請聲明來源鉆瓜專利網。





