[發明專利]一種知識圖譜的構建方法與系統在審
| 申請號: | 202011320762.1 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112287125A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 熊常春;王敬貴;李海良;張林;劉昂;吳江川;高曉影 | 申請(專利權)人: | 深圳季連科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/332;G06F40/295;G06Q30/02 |
| 代理公司: | 廣州海藻專利代理事務所(普通合伙) 44386 | 代理人: | 鄭鳳姣 |
| 地址: | 518000 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 構建 方法 系統 | ||
本發明根據用戶數據構建的知識圖譜和廣告用戶以及相關用戶的回答,識別廣告用戶;根據識別出的廣告用戶以及獲取節點廣告概率值較高的節點,從知識圖譜中去除與之相關的三元組;根據用戶的問題,通過實體識別和關系預測技術得到知識圖譜對應三元組中的主語和謂語,返回用戶提問問題的答案;在用戶與聊天機器人聊天過程中,對聊天機器人回答內容進行的評價,識別答案中是否有廣告答案,當遇到廣告內容或用戶差評時,確定該用戶為廣告敏感者;根據廣告敏感者的判定,機器人回答他們的問題時,選擇偏向非廣告的答案。本發明知識圖譜的構建對廣告的注入進行有效地識別,并有針對性的清理知識圖譜中含有的廣告內容的三元組。
【技術領域】
本發明涉及人工智能領域,尤其涉及一種基于用戶回答問題的知識圖譜的構建時,有效識別攻擊者及知識圖譜中違規的三元組。
【背景技術】
ConceptNet知識圖譜主要依靠互聯網眾包、專家創建和游戲三種方法來構建。其中專家構建知識圖譜是基于內部人員能夠控制的,但是專家數量畢竟少數,大多數的知識圖譜數據依然來源于通過眾包和最初來源于游戲的conceptnet,它根據在游戲中提問,而抽取出用戶的答案,并構建出知識圖譜,但是別有用心的人,在知識圖譜構建過程中,會通過多人同時故意輸入錯誤的廣告內容,而污染系統正確性。
發明專利CN201910290476.6基于災害場景的知識圖譜構建方法,從一個或多個災害數據源中獲取災害場景的數據信息,并對所獲取的數據進行知識融合、消除數據間的矛盾和歧義,對知識融合后的數據信息進行知識推理。但該發明在構建知識圖譜的時候,并沒有對信息進行廣告識別,不能很好的判斷信息是否都為廣告信息。
本發明可以有效檢測出含有廣告內容的三元組以及相關聯的用戶,針對性的對三元組和用戶進行刪除,避免了在用知識圖譜做問答時,出現大量廣告內容的情形。
【發明內容】
本發明提供了一種知識圖譜的構建方法用于基于用戶回答問題去除知識圖譜的構建與去除知識圖譜中的廣告三元組,使知識圖譜中的三元組更具有存在的意義。
本發明提供了一種知識圖譜的構建方法,主要包括以下步驟:
根據用戶問答過程構建的知識圖譜和廣告用戶以及相關用戶的回答,識別廣告用戶;根據識別出的廣告用戶,從知識圖譜中去除與之相關的三元組;根據知識圖譜中已有三元組中的實體,通過廣告詞概率分析,獲取節點廣告概率表,并去除廣告概率值較高的節點;根據用戶的問題,通過實體識別和關系預測技術得到知識圖譜對應三元組中的主語和謂語,返回用戶提問問題的答案;在用戶與聊天機器人聊天過程中,對聊天機器人回答內容進行的評價,識別答案中是否有廣告答案,當遇到廣告內容或用戶差評時,定義該用戶為廣告敏感者;根據廣告敏感者的判定,機器人回答他們的問題時,答案要更加的偏向非廣告;
進一步可選地,如上所述的方法中,所述根據用戶游戲數據構建的知識圖譜和廣告用戶以及相關用戶的回答,識別廣告用戶,主要包括:
用戶回答問題后,concepnet會根據問題和答案抽取出相應的三元組,即(主語,謂語,賓語)。將剛剛抽取到的三元組中的主語即用戶名取出來,將它與用戶表中用戶名進行精確匹配,如果沒有匹配成功,則將該用戶判定為新用戶,如果匹配成功,說明該用戶之前在游戲中回答過別的問題,根據用戶表,得到此用戶回答過的問題總數,當問題總數小于預設閾值,例如3,判定該用戶為新用戶;當問題總數超過預設閾值,例如3,則判定該用戶為非新用戶。
對于非新用戶,根據用戶表中此非新用戶對應的三元組id,將剛剛生成的三元組中的賓語分別與知識圖譜中對應的三元組中的賓語進行相似度匹配以及將三元組中的謂語和知識圖譜中對應三元組中的謂語輸入到情感分析模塊,確定此用戶回答問題的情感方向,所述情感分析模塊中包含的情感方向包括喜歡、批評兩大類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳季連科技有限公司,未經深圳季連科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011320762.1/2.html,轉載請聲明來源鉆瓜專利網。





