[發明專利]人物共現關系確定方法、專家推薦方法、裝置及設備有效
| 申請號: | 201711477743.8 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108287875B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 蔡巍;崔朝輝;趙立軍;張霞 | 申請(專利權)人: | 東軟集團股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/9536 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 劉曉菲;王寶筠 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人物 關系 確定 方法 專家 推薦 裝置 設備 | ||
本申請實施例公開了一種人物共現關系確定方法、專家推薦方法、裝置及設備,提高了人物共現關系確定準確率以及實現了為用戶推薦專家的目的。其中,人物共現關系確定方法包括:獲取第一人物的第一文本集合和第二人物的第二文本集合;從所述第一文本集合中抽取所述第一人物參與的事件,形成第一事件集合;從所述第二文本集合中抽取所述第二人物參與的事件,形成第二事件集合;從所述第一事件集合和所述第二事件集合中確定相同事件;基于所述相同事件構建所述第一人物和所述第二人物的共現關系。
技術領域
本申請涉及大數據領域,尤其涉及一種人物共現關系確定方法、專家推薦方法、裝置及設備。
背景技術
人物的共現關系是指兩個或多個人物由于共同出現而建立的關系。人物的共現關系可以反映人物的社會合作或交往關系,是非常重要的信息。
現有技術中人物共現關系根據兩個或多個人物在文本中同時出現的頻次來進行確定,但是同時出現的頻次高并不一定能反映出人物之間是具有關系的,比如說,有多家新聞媒體在同一天報道了兩個事件,這兩個事件分別和一個人物相關,且這兩個事件毫無關系,那么雖然這兩個人物同時出現在這些新聞媒體在該天的新聞報道中,在文本中同時出現的頻次較高,但是二者之間沒有任何關系。可見,基于在文本中同時出現的頻次來確定人物共現關系的方法準確性較低。
發明內容
為了解決現有技術中存在的技術問題,本申請提供了一種人物共現關系確定方法、專家推薦方法、裝置及設備,實現提高人物共現關系確定準確性以及為用戶推薦專家的目的。
本申請實施例提供了一種人物共現關系確定方法,所述方法包括:
獲取第一人物的第一文本集合和第二人物的第二文本集合;
從所述第一文本集合中抽取所述第一人物參與的事件,形成第一事件集合;
從所述第二文本集合中抽取所述第二人物參與的事件,形成第二事件集合;
從所述第一事件集合和所述第二事件集合中確定相同事件;
基于所述相同事件構建所述第一人物和所述第二人物的共現關系。
可選的,所述基于所述相同事件確定所述第一人物和所述第二人物的共現關系包括:
從所述第一文本集合中確定包含所述相同事件的文本,形成第三文本集合;
獲取所述第三文本集合中各個文本的關鍵詞,形成第一關鍵詞集合;
從所述第二文本集合中確定包含所述相同事件的文本,形成第四文本集合;
獲取所述第四文本集合中各個文本的關鍵詞,形成第二關鍵詞集合;
若所述第一關鍵詞集合和第二關鍵詞集合之間的相似性大于預設閾值,則構建所述第一人物和所述第二人物之間的共現關系。
可選的,所述第三文本集合和/或所述第四文本集合包括第一文本,根據如下方法得到所述第一文本的關鍵詞:
對所述第一文本進行分詞,得到第一特征詞;
根據所述第一特征詞在所述第一文本中出現的頻次,以及其他特征詞與所述第一特征詞出現在同一個句子中的次數,得到所述第一特征詞是否屬于所述第一文本的關鍵詞的判斷結果。
可選的,所述從所述第一事件集合和所述第二事件集合中確定相同事件包括:
從所述第一事件集合和所述第二事件集合中確定事件內容相同,且事件發生時間和事件發生地點至少其中一個相同的事件。
本申請實施例還提供了一種專家推薦方法,所述方法包括:
獲取待進行專家推薦的目標研究方向;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東軟集團股份有限公司,未經東軟集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711477743.8/2.html,轉載請聲明來源鉆瓜專利網。





