[發明專利]一種基于異構物品使用事件的物品語意標注方法在審
| 申請號: | 201810205055.4 | 申請日: | 2018-03-13 |
| 公開(公告)號: | CN108427752A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 陳垣毅;鄭增威;王馳 | 申請(專利權)人: | 浙江大學城市學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 杭州九洲專利事務所有限公司 33101 | 代理人: | 張羽振 |
| 地址: | 310015*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 隱式 使用事件 異構 標注 語義標注 二分類 語意 變量模型 潛在關系 特征預測 物品顯示 訓練數據 語義標簽 顯式 聚合 標簽 挖掘 預測 | ||
1.一種基于異構物品使用事件的物品語意標注方法,其特征在于,包括以下步驟:
1)建立物品潛在關系強度挖掘模型:定義為物品oi和oj之間的使用事件,I(ij)為物品oi與oj之間的潛在關系強度,為物品之間屬性相似度的評價指標,表示一些為了增加模型準確性引入的輔助變量;對物品潛在關系強度與其使用事件的頻率之間的關系進行分析與變換可以得到如下表述形式:
對凸函數L使用隨機梯度下降法來估計參數αl,βl,θl和Iij,求解一階導數與二階導數,使用Netwton-Raphson算法在每次迭代過程中更新參數∑={α,β,θ,ω}直至收斂;
2)提取物品隱式特征:定義G=<V,E,W>表示物品的top-k關系圖,其中V=Vs∪Vr是關系圖的頂點集,其中Vs是已經標注的物品集,Vr是未標注的物品集,E圖G的邊集合;對于oi,oj∈Vs,定義Wij=1,如果oi和oj具有相同的類別標簽,否則為0;如果oi,oj中至少一個物品未標注,Wij的值由上述公式確定:
其中Ωi=[Ωj1,Ωj2,...,Ωjk]為物品oi在top-k關系圖中的k近鄰集,η是一個權重調節參數;定義τi表明物品oi具有語義標簽μ,μ∈U,定義P(τi=μ|i),μ∈U為物品oi可能具有語義標簽μ的概率,為未標注物品初始化P(τi=μ|i)=1/|U|,如果物品oi具有語義標簽μ則初始化P(τi=μ|i)=1,否則初始化P(τi=μ|i)=0;利用隨機游走為每個物品計算P(τi=μ|i),μ∈U;隨機游走過程表示為如下公式:
Pt+l(τi=μ|Ωi)=(1-λ)MPt(Ωi)+λPr(τi=μ|Ωi)
當隨機游走過程收斂時,可以獲得物品oi上的每個標簽的概率估計值,并將其作為隱式特征FLatent訓練分類器;
3)提取物品顯示特征:利用文檔頻率/逆文檔頻率從文本資料中提取關鍵字,并將關鍵字的權重作為基本文字的顯示特征Ftext;將空間模式定義為F維向量:Fs(i)=[SFi(loc1),SFi(loc2),...,SFi(locF)];其中SFi(lock)通過公式計算,Ni(lock)為在位置lock發生的物品使用事件中包括物品oi的數目,為所有涉及物品oi的使用事件數量,F是位置類別數目;將時間模式定義為一個T維向量:FT(i)=[TFi(t1),TFi(t2),...,TFi(tT)],其中TFi(tk)通過進行計算,其中Ni(tk)為在時間戳tk發生的物品使用事件中包括物品oi的事件數目,為所有涉及物品oi的使用事件數量,T為時間戳數目;
4)訓練物品語義標注模型:提取上述四種特征后,將(FLatent+Ftext+FS+FT)組合在一起作為二分類SVM分類器的訓練數據,由所有獨立二分類器預測的標簽聚合作為物品的語義標注結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學城市學院,未經浙江大學城市學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810205055.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種短鏈接跳轉方法、裝置及電子設備
- 下一篇:一種新的數據挖掘方法





