[發明專利]基于機器學習的事務聚集發生預警方法及其應用在審
| 申請號: | 202211294234.2 | 申請日: | 2022-10-21 |
| 公開(公告)號: | CN115564156A | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 朱淑敏;黃宸;曹鵬寅;李斌;田雨 | 申請(專利權)人: | 城云科技(中國)有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/18;G06Q50/26;G06F16/35;G06F18/2321 |
| 代理公司: | 杭州匯和信專利代理有限公司 33475 | 代理人: | 陳江 |
| 地址: | 310052 浙江省杭州市濱江區長*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 機器 學習 事務 聚集 發生 預警 方法 及其 應用 | ||
1.基于機器學習的事務聚集發生預警方法,其特征在于,包括以下步驟:
S00、提取原有數據的特征結構,該特征結構至少包括事務文本內容;
S10、提取所述事務文本內容中的文本內容,并將該文本內容拆分為地址字段特征、人名字段特征、事務人數字段特征及原始文本字段特征,以實現對所述特征結構的補齊;
S20、將所述地址字段特征轉換成標準結構化地址及其經緯度數據,以作為新特征單獨存儲;
S30、通過遞歸密度聚類算法選取任一經緯度數據作為數據組點,并找到該數據組點密度可達的所有數據對象點形成一個簇,再將在同一簇下的數據組分類為同類數據;
S40、通過文本相似度算法處理同類數據下的文本字段,進一步優化分類結果并將同一類目下的相似事務作為結果存儲至結果表;
S50、輸出結果表并根據該結果表預警。
2.如權利要求1所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S00中,所述特征結構還包括標識ID,該標識ID用于標識事務。
3.如權利要求1所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S00中,所述特征結構還包括事務時間和事務地點。
4.如權利要求1所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S10中,通過地圖軟件的開放API將所述地址字段特征轉換成標準結構化地址及其經度和緯度數據。
5.如權利要求1所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S30中,若選取的數據組點為邊緣點,則選取另一個數據對象點,直至所有數據對象點被處理。
6.如權利要求1所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S30中,根據簇群分布情況,按照簇的大小進行密度聚類形成新的簇,并進行遞歸,直至到達設定條件形成遞歸結果,并將遞歸結果中的同一類簇下的數據組點歸類為同類數據。
7.如權利要求6所述的基于機器學習的事務聚集發生預警方法,其特征在于,步驟S30中,通過DBSCAN算法將同一類簇下的數據組點歸類為同類數據。
8.一種基于機器學習的事務聚集發生預警裝置,其特征在于,包括:
數據提取模塊,用于提取原有數據的特征結構,該特征結構至少包括事務文本內容;
數據補全模塊,用于提取事務文本內容中的文本內容,并將該文本內容拆分為地址字段特征、人名字段特征、事務人數字段特征及原始文本字段特征,以實現對特征結構的補齊;
數據轉換模塊,用于將地址字段特征轉換成標準結構化地址及其經緯度數據,以作為新特征單獨存儲;
遞歸密度聚類模塊,用于通過遞歸密度聚類算法選取任一經緯度數據作為數據組點,并找到該數據組點密度可達的所有數據對象點形成一個簇,再將在同一簇下的數據組分類為同類數據;
文本相似度計算模塊,用于通過文本相似度算法處理同類數據下的文本字段,進一步優化分類結果并將同一類目下的相似事務作為結果存儲至結果表;
輸出模塊,用于輸出結果表并根據該結果表預警。
9.一種電子裝置,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機程序,所述處理器被設置為運行所述計算機程序以執行權利要求1至7任一項所述的基于機器學習的事務聚集發生預警方法。
10.一種可讀存儲介質,其特征在于,所述可讀存儲介質中存儲有計算機程序,所述計算機程序包括用于控制過程以執行過程的程序代碼,所述過程包括根據權利要求1至7任一項所述的基于機器學習的事務聚集發生預警方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于城云科技(中國)有限公司,未經城云科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211294234.2/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





