[發明專利]一種基于改進馬爾科夫鏈的店鋪信用風險預測方法在審
| 申請號: | 201811430043.8 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109345272A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 徐新勝;唐敬文 | 申請(專利權)人: | 中國計量大學 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06Q30/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 店鋪 信用 風險預測 中文自然語言處理 馬爾科夫鏈 馬爾科夫鏈模型 預處理 電子商務安全 商品指定信息 網絡爬蟲技術 多維度數據 安全監管 電子商務 店鋪商品 評論文本 情感分析 綜合評價 改進 語料庫 構建 數據庫 保存 融合 預測 監管 優化 | ||
1.一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:
步驟1:店鋪語料庫獲取
利用網絡爬蟲軟件,制定爬取規則,抓取與指定店鋪相關的店鋪信息及店鋪的相關產品的評論文本,以結構化形式保存到數據庫中;
步驟2:中文自然語言處理
首先對抓取的商品評論數據進行數據清理操作,然后利用中文自然語言處理工具對評論語料分別進行初次分詞及詞性標注、關鍵詞及語氣詞的識別等預處理以獲得結構化的情感分析結果并保存到數據庫中,進一步,將這些關鍵詞及語氣詞與詞庫中關鍵字及語氣詞進行對比,計算得到評論真實度值;
步驟3:信用風險預測
首先提出店鋪信用綜合評價表,并基于該模板計算出每個店鋪的信用值;進一步,構建出改進的馬爾科夫鏈模型,根據此模型完成對店鋪的信用值預測,最后,根據信用值得分得到店鋪的風險等級。
2.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:在步驟1中,爬蟲技術是通過網頁中的HTTP協議,把制定好的正則表達式用來采集電商網站的某店鋪的詳細信息及店鋪內所有商品評論區的評論信息。
3.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:在步驟2中,(1)對文本數據的清理主要是對評論文本數據缺省值、文本重復和評論字數限制的預處理;(2)對提取的關鍵詞與語氣詞的文本數據的情感分析。
4.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:用整理的情感詞詞典對數據庫里面的商品評論提取的關鍵詞及語氣詞進行對比,判斷買家評論和給出的實際評分的差距,給定度量值3表示評論與實際評分相符,度量值1表示評論與實際評分不符,將本月所有評論的得分取平均值為該月商品評論的真實值。
5.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:選取抓取到的店鋪信息里一些關鍵指標,包括賣家信用、買家信用、執照信息、售后率、評論真實度,然后對這些指標進行BP神經網絡訓練得到這些因子的權重,計算每個店鋪信用值的得分。
6.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:在步驟3中,店鋪的總信用值得分的計算公式為:
R=Rn+Sn
其中,Rn表示C2C電子商務現有的信用評價模型,Sn表示新的信用評價模型。
7.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:在步驟3中,店鋪總信用值得計算公式中,Rn的計算公式為:
Rn=Rn-1+rn,…rn∈{-1,0,1}
其中,Rn表示用戶的當前信用度,Rn-1表示用戶近期信用度,rn表示用戶得到第n次信用反饋評分,rn∈{-1,0,1}。
8.如權利要求1所述的一種基于改進馬爾科夫鏈的店鋪信用風險預測方法,其特征在于:在步驟3中,店鋪總信用值得計算公式中,Sn的計算公式為:
Sn=α*S1+β*S2+γ*S3+δ*S4+ε*S5
其中,S1,S2,S3,S4,S5分別表示為賣家信用、買家信用、執照信息、售后率、評論真實度;α,β,γ,δ,ε分別表示各個因子對應的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國計量大學,未經中國計量大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811430043.8/1.html,轉載請聲明來源鉆瓜專利網。





