[發明專利]基于語義風險自適應識別的物流安檢方法有效
| 申請號: | 202011474082.5 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112633652B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 衛振林;奇格奇;李寶文;蘇牧野;黃少陽;薛瑋珉 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06Q10/0635 | 分類號: | G06Q10/0635;G06Q10/0832;G06Q30/0601;G06F18/23213;G01V5/00 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 姜威 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 風險 自適應 識別 物流 安檢 方法 | ||
1.一種基于語義風險自適應識別的物流安檢方法,其特征在于,包括:
掃描待識別物流訂單,獲取物流訂單的信息;所述的物流訂單的信息包括:收寄件人信息r和物品信息g;
根據所述物流訂單的信息,分別獲取所述信息對應的人員風險權重值、相關物品標志位值;
采用語義風險自適應識別方法計算所述信息對應的物品語義風險值;具體包括:
S41采用網絡文本提取方法構建網絡文本庫,并從所述網絡文本庫中提取法院判決書文本內容,從所述文本內容中提取作案工具和判決結果;
S42將所述作案工具轉換為物品名稱,將所述判決結果從自然語言轉化為表示刑罰輕重程度的風險數值,構造物品名稱和風險數值的向量集合;
S43根據隱含狄利克雷分布模型,以網絡文本庫中提取的每一份法院判決書為文檔d,物品名稱為單詞t,風險數值作為單詞的重復數量,建立物品風險主題模型;
S44以得到的物品風險主題模型為依據,根據下式(1)和(2)分別計算每個文檔下的物品風險主題概率分布θdk與物品風險主題的物品名稱概率分布
其中,為文檔d中歸屬于主題k的單詞數量統計,為所有文檔中歸屬于主題k的單詞t的數量統計,αk為文檔中主題k分布的超參數,βt為主題中詞t分布的超參數,K為主題數量,T為單詞數量,j為表示主題的求和變量,為文檔d中歸屬于主題j的單詞數量統計,αj為文檔中主題j分布的超參數,l為表示單詞的求和變量,為所有文檔中歸屬于主題k的單詞l的數量統計,βl為主題中詞l分布的超參數;
S45基于模糊均值聚類模型對每個文檔下的物品風險主題概率分布做進一步聚類,獲得物品風險主題分布的聚類中心與各物品風險主題分布對聚類中心的隸屬度;
S46對聚類后的物品風險主題進行標準化處理并設定各中心點的風險數值rc;
S47將所述的物品信息g作為新文檔,通過建立的物品風險主題模型獲得該物品信息g的風險主題分布xg,再根據獲得該風險主題分布對各聚類中心點的隸屬度ugc,以中心點風險數值為原值,隸屬度為權值,根據下式(3)計算出所述物品信息g對應的物品語義風險值Sg:
其中,R={rc}(c=1,2,…,C)為不同聚類中心對應的風險數值;
根據所述的人員風險權重值、相關物品標志位值和物品語義風險值,計算安檢物流訂單風險識別值;具體包括根據下式(4)計算安檢物流訂單風險識別值:
Rh={r,g}=wrmax(Ig,Sg)????(4)
其中,wr為人員風險權重值,Ig為相關物品標志位值,Sg為物品語義風險值,g為物品信息,r為收寄件人信息;
所述的隸屬度根據下式(5)計算;
其中,xg=(θg1,θg2,…,θgK)為物品信息g的物品風險主題分布,ugc為物品信息g的物品風險主題分布對聚類中心的隸屬度,m為模糊因子,V={vc}(c=1,2,…,C)為聚類中心,聚類中心即將物品風險主題分布進行聚類后,每一類別下的中心點,C表示物品風險主題分布分類個數,vc表示第c類物品風險主題分布的聚類中心,e為表示聚類中心的求和變量,ve表示第e類物品風險主題分布的聚類中心;
所述的根據隱含狄利克雷分布模型,以網絡文本庫中的每一份法院判決書為文檔d,物品名稱為單詞t,風險數值作為單詞的重復數量,建立物品風險主題模型,包括:
1)依據歷史數據確定主題數K,并選取狄利克雷分布超參數α和β,參數α維度為K,參數β維度為T;
2)初始化主題編號,隨機給每一篇文檔的每一個單詞分配主題編號,將第d篇文檔中的第q個單詞定義為wi,其中i=(d,q)是一個二維下標,單詞wi對應一個生成所述單詞的主題編號為Zi,其中Zi∈{1,2,…,K};
3)令迭代次數n=1,根據下式(6)和(7)計算每個文檔下的物品風險主題概率分布與物品風險主題的物品名稱概率分布
其中,為文檔d中歸屬于主題k的單詞數量統計,為所有文檔中歸屬于主題k的單詞t的數量統計,αk為文檔中主題k分布的超參數,βt為主題中詞t分布的超參數,K為主題數量,T為單詞數量,j為表示主題的求和變量,為文檔d中歸屬于主題j的單詞數量統計,αj為文檔中主題j分布的超參數,l為表示單詞的求和變量,為所有文檔中歸屬于主題k的單詞l的數量統計,βl為主題中詞l分布的超參數;
4)重新掃描網絡文本庫,對網絡文本庫中的每一個單詞通過下式(8)更新主題編號,得到當前單詞屬于所有主題Zi=1,Zi=2,…,Zi=K的概率分布,然后重新為單詞采樣一個新的主題Zi,即每次排除當前詞wi的主題分布Zi,根據其他所有詞的主題分類,估計當前詞wi分配到各個主題Zi=1,Zi=2,…,Zi=K的概率:
其中,表示在該集合中去除下標為i的元素,為文檔d中去除詞wi后其余歸屬于主題j的單詞數量統計,為去除詞wi后所有文檔中歸屬于主題k的單詞l的數量統計;
5)以步驟4)對詞重新分配主題后的結果根據下式(9)和(10)計算更新每個文檔下的物品風險主題概率分布和每個物品風險主題的物品名稱概率分布;
6)根據所述分布結果判斷是否滿足下式(11),如果滿足則停止計算,輸出最終計算的主題模型;否則令n=n+1,返回步驟4):
其中,ε為小于或等于0.001的正數;
所述的基于模糊均值聚類模型對物品風險主題分布做進一步聚類,獲得物品風險主題分布的聚類中心與各物品風險主題分布對聚類中心的隸屬度的具體步驟為:
S81選擇聚類數的范圍[Cmin,Cmax];
S82對于C=Cmin到C=Cmax的每一個聚類數執行如下操作:
S821在滿足公式(12)的條件下,隨機生成初始化隸屬度矩陣U(1),令迭代次數n=1,在滿足下式(12)的約束條件下,將值在[0,1]范圍間的隨機數賦予給
S822根據下式(13)計算各聚類中心vc;
其中,X={xd}(d=1,2,…,D)為網絡文本庫中文檔的物品風險主題分布,V={vc}(c=1,2,…,C)為聚類中心,U={udc}(d=1,2,…,D;c=1,2,…,C)為網絡文本庫中文檔物品風險主題分布對聚類中心的隸屬度,m為模糊因子;
S823根據步驟S822計算的聚類中心,更新下式(14)隸屬矩陣U(n+1);
其中,e為表示聚類中心的求和變量,表示第n次迭代的第e類物品風險主題分布的聚類中心;
S824判斷是否滿足下式(15),如果滿足則轉至S825;否則令n=n+1,返回至S82;
其中,η為小于或等于0.001的正數;
S825以最終計算的隸屬矩陣U(n+1),根據下式(16)更新最終的聚類中心并輸出最終的聚類中心和隸屬度矩陣;
S83根據下式(17)計算各聚類數下的有效性函數值,選擇最小函數值所對應的C即為最佳聚類數,并輸出所對應的聚類中心和隸屬度矩陣:
判斷所述的安檢物流訂單風險識別值是否大于設定的風險閾值,如果大于,則通過安檢設備發出預警提示,用于通知安檢人員對所述訂單進一步檢查;否則,不發出預警提示。
2.根據權利要求1所述的方法,其特征在于,所述的所述物流訂單的信息,分別獲取所述信息對應的人員風險權重值、相關物品標志位值,包括:
將所述的收寄件人信息r與相關人員數據庫匹配,對不同類別人群進行加權處理,獲得人員風險權重值wr;
依據物流企業禁止寄遞物品列表,以貨物名稱和貨物類型建立相關物品數據庫,排查所述的物品信息g是否在所述的相關物品數據庫中,獲得相關物品標志位值Ig,其中,Ig=0表示未匹配相關物品數據庫中的相關物品,Ig=1表示匹配相關物品數據庫中的相關物品。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011474082.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





