[發明專利]一種數據表分類方法、裝置、設備及存儲介質在審
| 申請號: | 202211208626.2 | 申請日: | 2022-09-30 |
| 公開(公告)號: | CN115599975A | 公開(公告)日: | 2023-01-13 |
| 發明(設計)人: | 王和平;尹強;楊永坤;夏晨;笪尚;白樂;郝謀洪;邸帥;盧道和 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06F16/28;G06F16/901 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 雷航 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據表 分類 方法 裝置 設備 存儲 介質 | ||
1.一種數據表分類方法,其特征在于,包括:
從多個預設關鍵詞中確定出與數據表的各維度表信息匹配的至少一個目標關鍵詞;
針對任一目標關鍵詞,基于分類標簽對應關系,確定所述目標關鍵詞對應的目標分類標簽,以及所述目標關鍵詞與所述目標分類標簽相關聯的多維度卡方值;所述分類標簽對應關系是根據多個樣本數據表確定的每個預設關鍵詞的分類關系;其中,每個預設關鍵詞的分類關系包括預設關鍵詞所屬的分類標簽及預設關鍵詞與所屬的分類標簽相關聯的多維度卡方值;多維度卡方值用于表征預設關鍵詞在多個維度表信息下與所屬的分類標簽相關性;
基于每個目標關鍵詞對應的目標分類標簽以及每個目標關鍵詞與所述目標分類標簽相關聯的多維度卡方值,確定所述數據表的分類結果。
2.如權利要求1所述的方法,其特征在于,所述分類標簽對應關系是根據多個樣本數據表確定的每個預設關鍵詞的分類關系,包括:
針對任一預設關鍵詞,基于所述多個樣本數據表,分別確定所述預設關鍵詞與每個候選分類標簽的多維度卡方值;
從多個多維度卡方值中選取最大的多維度卡方值,并且當最大的多維度卡方值大于卡方分布的臨界值時,將最大的多維度卡方值所對應的候選分類標簽,作為所述預設關鍵詞所屬的分類標簽,并將所述最大的多維度卡方值作為所述預設關鍵詞與所屬的分類標簽相關聯的多維度卡方值。
3.如權利要求2所述的方法,其特征在于,所述針對任一預設關鍵詞,基于所述多個樣本數據表,分別確定所述預設關鍵詞與每個候選分類標簽的多維度卡方值,包括:
針對任一預設關鍵詞對應的任一候選分類標簽,執行以下步驟:
基于所述多個樣本數據表,分別確定每個維度表信息對應的置信值;所述置信值用于表征每個維度信息與候選分類標簽的相關性;
基于每個維度表信息對應的置信值,以及每個維度表信息中所述預設關鍵詞與所述候選分類標簽相關聯的單維度卡方值,確定所述預設關鍵詞與所述候選分類標簽的多維度卡方值。
4.如權利要求3所述的方法,其特征在于,所述分別確定每個維度表信息對應的置信值,包括:
針對任一維度表信息,基于所述多個樣本數據表,確定所述維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值;
基于每個維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值,確定每個維度表信息的權重因子;
針對任一維度表信息,采用所述維度表信息的權重因子,對所述維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值進行調整,獲得所述維度表信息的置信值。
5.如權利要求4所述的方法,其特征在于,所述基于所述多個樣本數據表,確定所述維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值,包括:
確定所述多個樣本數據表的維度表信息中包含所述預設關鍵詞的第一數據表量;
確定所述多個樣本數據表的維度表信息中包含所述預設關鍵詞,且所述多個樣本數據表屬于所述候選分類標簽的第二數據表量;
將所述第二數據表量與所述第一數據表量的比值,作為所述關聯概率值。
6.如權利要求4所述的方法,其特征在于,所述基于每個維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值,確定每個維度表信息的權重因子,包括:
確定每個維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值的和,作為關聯概率總值;
針對任一維度表信息,基于所述維度表信息中所述預設關鍵詞與所述候選分類標簽的關聯概率值,以及關聯概率總值,確定所述維度信息的權重因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211208626.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種剔墨紗燈的制作工藝
- 下一篇:一種全自動白炭黑生產設備





