[發明專利]基于人工智能構建評論圖譜的方法和裝置有效
| 申請號: | 201710400557.8 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107220352B | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 時迎超;崔建青;和為 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/955;G06F16/95 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 構建 評論 圖譜 方法 裝置 | ||
本申請公開了基于人工智能構建評論圖譜的方法和裝置。方法的一具體實施方式包括:基于網絡頁面中的評論數據,確定評論文本;根據評論文本中的特征,識別評論文本中的評論主體和評論觀點;基于評論主體和評論觀點,生成包括評論主體、評論觀點和情感傾向的主體觀點對;基于新聞資訊,生成與主體觀點對相關聯的評論標簽;基于評論標簽和主體觀點對,生成評論圖譜。該實施方式在對外提供評論時,提高了評論的針對性、精準性以及對評論情感的控制,并且由于構建評論圖譜的來源豐富,覆蓋面廣,因此向外提供的評論也反映大多數評論意見,提升了評論圖譜的適用范圍。
技術領域
本申請涉及計算機技術領域,具體涉及計算機網絡技術領域,尤其涉及基于人工智能構建評論圖譜的方法和裝置。
背景技術
人工智能(Artificial Intelligence,簡稱AI)技術的快速發展為人們的日常工作和生活提供了便利。人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智能越來越多地融入到應用中,結合人工智能的應用可以準確地確定出信息的種類,并按照不同用戶的需求將不同種類的信息推送給相應的用戶。
隨著人工智能的飛速發展,如何讓機器能擁有和人類一樣的智能,成了無數企業希望做到的事情。在這個背景下,我們希望機器能夠讀懂一篇文章,并且能夠給出有自己觀點的評論,或者給出互聯網用戶對這篇文章的一般觀點。
目前的機器評論,一般都是通過傳統的信息檢索技術,基于新聞關鍵詞索引出相關新聞的評論,并基于新聞與新聞的相關性以及新聞與評論的相關性,選出最相關的評論。
然而,目前的機器評論,人云亦云,給出的評論必須是用戶已經在相同或者類似新聞中發表的評論,機器本身并不理解新聞的內容和評論的內容,并且由于檢索召回的依據是新聞和評論的相關性,普遍存在冷門新聞無法召回的問題,如果放開相關性限制,容易產出不相關的回復,并且嚴重依賴評論庫的時效性,質量以及大小,因此影響面和召回率低。
發明內容
本申請的目的在于提出一種改進的基于人工智能構建評論圖譜的方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請實施例提供了一種基于人工智能構建評論圖譜的方法,方法包括:基于網絡頁面中的評論數據,確定評論文本;根據評論文本中的特征,識別評論文本中的評論主體和評論觀點;基于評論主體和評論觀點,生成包括評論主體、評論觀點和情感傾向的主體觀點對;基于新聞資訊,生成與主體觀點對相關聯的評論標簽;基于評論標簽和主體觀點對,生成評論圖譜。
在一些實施例中,基于評論主體和評論觀點,生成包括評論主體、評論觀點和情感傾向的主體觀點對包括:基于評論主體、評論觀點以及以下三項中的一項或多項:評論文本的篇章信息、共現信息以及實體類型,提取包括評論主體、評論觀點和情感傾向的主體觀點對。
在一些實施例中,基于新聞資訊,生成與主體觀點對相關聯的評論標簽包括:基于新聞資訊,確定新聞標簽;計算新聞標簽與評論文本的相關性;將相關性符合預設閾值的新聞標簽確定為與主體觀點對相關聯的評論標簽。
在一些實施例中,基于新聞資訊,確定新聞標簽包括:根據新聞資訊中詞語的預定特征,采用權重模型確定詞語的權重;基于詞語的權重和詞語之間的共現特征,確定新聞標簽。
在一些實施例中,權重模型根據以下步驟確定:獲取新聞資訊樣本;根據新聞資訊樣本中詞語的預定特征,采用支持向量機訓練權重模型。
在一些實施例中,基于新聞資訊,確定新聞標簽還包括:從新聞資訊中抽取事件,事件包括事件類型和事件元素;若事件元素中存在事件元素被選為新聞標簽,則將事件確定為新聞標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710400557.8/2.html,轉載請聲明來源鉆瓜專利網。





