[發明專利]一種知識圖譜的構建方法與系統在審
| 申請號: | 202011320762.1 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112287125A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 熊常春;王敬貴;李海良;張林;劉昂;吳江川;高曉影 | 申請(專利權)人: | 深圳季連科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/332;G06F40/295;G06Q30/02 |
| 代理公司: | 廣州海藻專利代理事務所(普通合伙) 44386 | 代理人: | 鄭鳳姣 |
| 地址: | 518000 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 構建 方法 系統 | ||
1.一種知識圖譜的構建方法,其特征在于,所述方法包括:
根據用戶數據構建的知識圖譜和廣告用戶以及相關用戶的回答,識別廣告用戶;
獲取用戶數據,以及利用所述用戶數據構建的知識圖譜,所述知識圖譜包括三元組;
利用所述用戶數據識別出廣告用戶以及所述廣告用戶提交的數據;
從所述知識圖譜中去除與所述廣告用戶提交的數據相關的三元組;
在去除與所述廣告用戶提交的數據相關的三元組后,進一步識別知識圖譜中的廣告節點并去除,得到最終的知識圖譜;根據識別出的廣告用戶以及獲取節點廣告概率值較高的節點,從知識圖譜中去除與之相關的三元組;
將所述最終的知識圖譜應用于聊天機器人,所述聊天機器人在獲取用戶的問題后,通過實體識別和關系預測技術得到知識圖譜對應三元組中的主語和謂語,返回用戶提問問題的答案;
在用戶與聊天機器人聊天過程中,對聊天機器人回答內容進行的評價,識別答案中是否有廣告答案,若檢測到廣告內容或用戶差評時,確定該用戶為廣告敏感者;
根據廣告敏感者的判定,機器人回答廣告敏感者的問題時,選擇偏向非廣告的答案。
2.根據權利要求1所述的方法,其中,所述根據用戶數據構建的知識圖譜和廣告用戶以及相關用戶的回答,識別廣告用戶,主要包括:
用戶回答問題后,根據問題和答案抽取出相應的三元組;
將抽取到的三元組中的主語即用戶名取出來,將它與用戶表中用戶名進行精確匹配,如果沒有匹配成功,則將該用戶判定為新用戶,如果匹配成功,根據用戶表,得到此用戶回答過的問題總數,當問題總數小于等于預設閾值時,判定該用戶為新用戶;
當問題總數超過預設閾值時,則判定該用戶為非新用戶,對于非新用戶,根據用戶表中非新用戶對應的三元組id,將生成的三元組中的賓語分別與知識圖譜中對應的三元組中的賓語進行相似度匹配以及將三元組中的謂語和知識圖譜中對應三元組中的謂語輸入到情感分析模塊,確定此用戶回答問題的情感傾向,所述情感分析模塊中包含的情感方向包括喜歡、批評兩大類;
對于新用戶以及通過之前檢測的用戶,通過他們使用電腦的IP地址和回答問題的時間,以回答問題時間為中間時間,分別向前、后增加預設分鐘數,在1小時的范圍內且在該IP地址所在的網絡段中,將回答同一問題的用戶挑選出來,將挑選出來的用戶和當前用戶的答案進行相似度匹配,判斷這些用戶是否為廣告發布者;
如果為廣告發布者,進一步判定該用戶是否與其他用戶形成團隊作案。
3.根據權利要求2所述的方法,其中,根據用戶表中非新用戶對應的三元組id,將生成的三元組中的賓語分別與知識圖譜中對應的三元組中的賓語進行相似度匹配,判定該用戶是否為廣告發布者,主要包括:
當前用戶與用戶表中存有的用戶匹配成功且判定為非新用戶時,如果此用戶生成的三元組中的賓語與知識圖譜中已存此用戶三元組的賓語相似度達到預設的閾值,則判斷該用戶為廣告發布者;當相似度在預設的閾值之間時,通過游戲中的系統消息給此用戶發警告信息。
4.根據權利要求2所述的方法,其中,將三元組中的謂語和知識圖譜中對應三元組中的謂語輸入到情感分析模塊,查看此用戶回答問題的情感方向,判定該用戶是否為廣告發布者,主要包括:
情感分析模塊對輸入的謂語根據喜歡和批評兩種情感方向進行劃分,通過喜歡方向的答案除以總問題數得到喜歡方向的占比率,同理通過批評方向的答案除以總問題數得到批評方向的占比率,這兩個占比率中的某一個值大于或等于預設的閾值,判定該用戶為廣告發布者。
5.根據權利要求2所述的方法,其中,判定該用戶是否與其他用戶形成團隊作案,主要包括:
當情感分析模塊得到的兩個占比率都小于預設的閾值時或判定為新用戶的用戶,進行團體作案判定,當某些用戶在當前用戶回單問題的預設時間范圍內且在該IP地址所在的網絡段時,將這些用戶和當前用戶的答案進行相似度匹配,如果相似度大于或等于預設的閾值,則判定這些用戶為廣告發布者,如果相似度低于預設的閾值,則判定這些用戶沒有關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳季連科技有限公司,未經深圳季連科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011320762.1/1.html,轉載請聲明來源鉆瓜專利網。





