[發(fā)明專利]商家風險評估方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201710880561.9 | 申請日: | 2017-09-26 |
| 公開(公告)號: | CN109615153B | 公開(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計)人: | 李屾;李楠;賀勇;張凱;唐超 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q10/0635 | 分類號: | G06Q10/0635;G06Q30/018;G06Q30/0601 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 王茹 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 商家 風險 評估 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種商家風險評估方法,其特征在于,所述方法包括:
獲取待評估商家的進項商品信息和銷項商品信息;
基于預設(shè)編碼方式將所述進項商品信息和銷項商品信息分別進行編碼;
基于編碼獲得的編碼信息從預設(shè)詞向量矩陣中查詢所述進項商品信息的詞向量和所述銷項商品信息的詞向量,所述預設(shè)詞向量矩陣為詞模型中的詞向量矩陣,所述詞模型基于具有相似性的商品信息對訓練得到,所述詞模型用于輸出與輸入商品信息相似的商品信息的編碼信息;
基于查詢獲得的詞向量對所述進項商品信息和銷項商品信息進行相似性判斷,并根據(jù)判斷結(jié)果對待評估商家進行風險評估。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述詞模型的構(gòu)建過程包括:
獲取具有相似性的商品信息,所述商品信息包括進項商品信息和/或銷項商品信息;
基于所述預設(shè)編碼方式對具有相似性的商品信息進行編碼,并構(gòu)成包含輸入數(shù)據(jù)與輸出數(shù)據(jù)的訓練樣本;
利用所構(gòu)建的訓練樣本對初始化詞模型進行訓練,獲得詞模型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取具有相似性的商品信息,包括:
按預設(shè)的序列構(gòu)造策略將不同樣本商家的進項商品信息和/或銷項商品信息進行排序,獲得每個商家對應的訓練序列;
將每條訓練序列中目標商品信息以及所述目標商品信息的上下文商品信息,確定為具有相似性的商品信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述序列構(gòu)造策略包括:
將樣本商家的進項商品信息和/或銷項商品信息隨機排序,獲得該樣本商家對應的訓練序列;或,
將樣本商家的進項商品信息和/或銷項商品信息按商品總金額大小進行降序排列;或,
將樣本商家的進項商品信息和銷項商品信息分別按商品總金額大小進行降序排列,并將降序排列獲得的兩個降序序列組合,組合滿足:相同排列序號的商品信息相鄰排列。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述按預設(shè)的序列構(gòu)造策略將不同樣本商家的進項商品信息和/或銷項商品信息進行排序,包括:
按預設(shè)的篩選策略將不同樣本商家的進項商品信息和/或銷項商品信息進行篩選,利用預設(shè)的序列構(gòu)造策略將篩選獲得的進項商品信息和/或銷項商品信息進行排序;
所述篩選策略至少包括以下一種策略:
從樣本商家的進項商品信息和/或銷項商品信息中,篩選出每項商品總金額大于指定金額閾值的進項商品信息和/或銷項商品信息;
從樣本商家的進項商品信息和/或銷項商品信息中,篩選出在所有樣本商家商品信息中出現(xiàn)頻率大于指定頻率閾值的進項商品信息和/或銷項商品信息。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述初始化詞模型包括CBOW模型或skip-gram模型。
7.根據(jù)權(quán)利要求1至6任一項所述的方法,其特征在于,所述基于查詢獲得的詞向量對所述進項商品信息和銷項商品信息進行相似性判斷,包括:
確定所述銷項商品信息的詞向量與待評估商家中各進項商品信息的詞向量的夾角余弦值;
若最大夾角余弦值小于指定余弦值,則判定所述銷項商品信息與進項商品信息不相似;若最大夾角余弦值大于或等于指定余弦值,則判定所述銷項商品信息與該最大夾角余弦值對應的進項商品信息相似。
8.根據(jù)權(quán)利要求1至6任一項所述的方法,其特征在于,所述根據(jù)判斷結(jié)果對待評估商家進行風險評估,至少包括以下一種評估方式:
確定待評估商家中進項商品信息與銷項商品信息的相似量,若所述相似量與銷項商品信息總量的比值小于預設(shè)的第一閾值,則判定所述待評估商家存在風險;
確定待評估商家中與進項商品信息不相似的銷項商品信息所對應的商品的總金額,若所確定的總金額與銷項商品信息所對應的商品的總金額的比值大于預設(shè)的第二閾值,則判定所述待評估商家存在風險。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710880561.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





