[發明專利]目標人物間親密度識別方法、裝置、電子設備及存儲介質有效
| 申請號: | 201911056228.1 | 申請日: | 2019-10-31 |
| 公開(公告)號: | CN110825847B | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 陳鵬禮;尚高峰;杜國強 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F40/279 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 李欣;丁蕓 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 人物 親密 識別 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供了一種目標人物間親密度識別方法、裝置、電子設備及存儲介質,通過獲取語料庫,利用預設的熱詞提取方法,從語料庫中提取各熱詞,并獲取各熱詞的親密度標注信息,針對語料庫中多個待分析文本數據的各條句子,若識別出該條句子中包括至少兩個目標人物的名稱,則將該條句子添加至候選語料集,針對候選語料集中的各條句子,根據該條句子中各熱詞的親密度標注信息,確定該條句子對應的至少兩個目標人物的親密度關系,針對一組指定的至少兩個目標人物,根據候選語料集中各條句子分別對應的指定的至少兩個目標人物的親密度關系,確定指定的至少兩個目標人物間的親密度。通過本方案,提高了識別目標任務之間親密度的效率。
技術領域
本發明涉及計算機技術領域,特別是涉及一種目標人物間親密度識別方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網的不斷發展,互聯網中的文本數據也迅速增長,互聯網用戶需要花費大量的時間從中搜索出符合自己閱讀需求的文本內容。
當前的互聯網技術中,可以基于互聯網用戶的閱讀需求,向互聯網用戶推薦感興趣的文本內容,例如,如果互聯網用戶對人物A感興趣,則會將與人物A相關的所有文本內容都推薦給該互聯網用戶。
然而在實際應用時,當互聯網用戶閱讀到某一個目標人物的時候,有可能會關注與該目標人物親密的另一個目標人物的信息,因此,如何高效地識別不同的目標人物間的親密度,為文本內容推薦提供推薦依據,成為亟待解決的技術問題。
發明內容
本發明實施例的目的在于提供一種目標人物間親密度識別方法、裝置、電子設備及存儲介質,以提高識別目標人物之間的親密度的效率。具體技術方案如下:
第一方面,本發明實施例提供了一種目標人物間親密度識別方法,該方法包括:
獲取語料庫,其中,語料庫包括多個待分析文本數據;
利用預設的熱詞提取方法,從語料庫中提取各熱詞,并獲取各熱詞的親密度標注信息;
針對多個待分析文本數據中的各條句子,若識別出該條句子中包括至少兩個目標人物的名稱,則將該條句子添加至候選語料集;
針對候選語料集中的各條句子,根據該條句子中各熱詞的親密度標注信息,確定該條句子對應的至少兩個目標人物的親密度關系;
針對一組指定的至少兩個目標人物,根據候選語料集中各條句子對應的指定的至少兩個目標人物的親密度關系,確定指定的至少兩個目標人物間的親密度。
可選的,在針對多個待分析文本數據中的各條句子,若識別出該條句子中包括至少兩個目標人物的名稱,則將該條句子添加至候選語料集的步驟之前,該方法還包括:
分別將多個待分析文本數據中的各文本數據分割成多條句子,并對分割后的各條句子分別進行分詞處理,得到分割后的各條句子中的分詞數據;
針對多個待分析文本數據中的各條句子,識別該條句子中是否包括至少兩個目標人物的名稱的方式,包括:
針對分割后的各條句子,判斷該條句子中的分詞數據是否包括至少兩個目標人物的名稱。
可選的,在針對多個待分析文本數據中的各條句子,識別出該條句子中包括至少兩個目標人物的名稱的步驟之后,該方法還包括:
查詢預先建立的目標人物關系表,判斷至少兩個目標人物間是否存在關系;
將該條句子添加至候選語料集的步驟,包括:
若識別出該條句子中包括至少兩個目標人物的名稱,且至少兩個目標人物間存在關系,則將該條句子添加至候選語料集。
可選的,在利用預設的熱詞提取方法,從語料庫中提取各熱詞,并獲取各熱詞的親密度標注信息的步驟之后,該方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911056228.1/2.html,轉載請聲明來源鉆瓜專利網。





