[發明專利]基于人工智能構建評論圖譜的方法和裝置有效
| 申請號: | 201710400557.8 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107220352B | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 時迎超;崔建青;和為 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/955;G06F16/95 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 構建 評論 圖譜 方法 裝置 | ||
1.一種基于人工智能構建評論圖譜的方法,其特征在于,所述方法包括:
基于網絡頁面中的評論數據,確定評論文本;
根據所述評論文本中的特征,識別所述評論文本中的評論主體和評論觀點;
基于所述評論主體和所述評論觀點,生成包括所述評論主體、所述評論觀點和情感傾向的主體觀點對;
基于新聞資訊,生成與所述主體觀點對相關聯的評論標簽,所述評論標簽是約束評論的應用環境的詞的集合;
基于所述評論標簽和所述主體觀點對,生成評論圖譜。
2.根據權利要求1所述的方法,其特征在于,所述基于所述評論主體和所述評論觀點,生成包括所述評論主體、所述評論觀點和情感傾向的主體觀點對包括:
基于所述評論主體、所述評論觀點以及以下三項中的一項或多項:評論文本的篇章信息、共現信息以及實體類型,提取包括所述評論主體、所述評論觀點和情感傾向的主體觀點對。
3.根據權利要求1所述的方法,其特征在于,所述基于新聞資訊,生成與所述主體觀點對相關聯的評論標簽包括:
基于新聞資訊,確定新聞標簽;
計算所述新聞標簽與所述評論文本的相關性;
將所述相關性符合預設閾值的新聞標簽確定為與所述主體觀點對相關聯的評論標簽。
4.根據權利要求3所述的方法,其特征在于,所述基于新聞資訊,確定新聞標簽包括:
根據所述新聞資訊中詞語的預定特征,采用權重模型確定詞語的權重;
基于所述詞語的權重和所述詞語之間的共現特征,確定新聞標簽。
5.根據權利要求4所述的方法,其特征在于,所述權重模型根據以下步驟確定:
獲取新聞資訊樣本;
根據所述新聞資訊樣本中詞語的所述預定特征,采用支持向量機訓練權重模型。
6.根據權利要求4所述的方法,其特征在于,所述基于所述新聞資訊,確定新聞標簽還包括:
從新聞資訊中抽取事件,所述事件包括事件類型和事件元素;
若所述事件元素中存在事件元素被選為所述新聞標簽,則將所述事件確定為所述新聞標簽。
7.根據權利要求3所述的方法,其特征在于,所述計算新聞標簽與所述評論文本的相關性包括以下一項或多項:
根據同義詞詞典,計算所述新聞標簽中的專名或短語與所述評論主體的相關性;
基于預設的專名對應規則,計算所述新聞標簽中的專名與所述評論主體的相關性;
基于文本深度表示模型,計算由所述新聞標簽中的詞語生成的向量與由所述評論主體生成的向量的相似度;
基于文本深度表示模型,計算由從新聞資訊中抽取的事件的詞語生成的向量與由所述評論觀點生成向量的相似度;
基于文本深度表示模型,計算由所述新聞標簽的詞語生成的向量與由所述評論文本中除所述評論主體和所述評論觀點之外的實義詞生成的向量的相似度。
8.根據權利要求1至7任意一項所述的方法,其特征在于,所述基于所述評論標簽和評論內容,生成評論圖譜包括:
將所述評論標簽作為所述評論圖譜的標簽節點;
將所述主體觀點對作為所述評論圖譜的評論節點;
在所述標簽節點和對應所述標簽節點的所述評論節點之間建立連接關系。
9.根據權利要求8所述的方法,其特征在于,所述基于所述評論標簽和評論內容,生成評論圖譜還包括:
在語義關聯的所述評論節點之間,建立連接關系;和/或
在語義相同的所述標簽節點之間,建立連接關系。
10.根據權利要求9所述的方法,其特征在于,所述在語義關聯的所述評論節點之間,建立連接關系包括:
在語義相同和/或語義相反的所述評論節點之間,建立連接關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710400557.8/1.html,轉載請聲明來源鉆瓜專利網。





