[發明專利]觀點提取方法及裝置在審
| 申請號: | 201810205252.6 | 申請日: | 2018-03-13 |
| 公開(公告)號: | CN110309407A | 公開(公告)日: | 2019-10-08 |
| 發明(設計)人: | 沈一;蔡龍軍;茅越;李明 | 申請(專利權)人: | 優酷網絡技術(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06F17/27 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 觀點提取 編碼信息 特征信息 網絡模型 循環神經網絡 編碼模塊 解碼模塊 輸入編碼 輸入解碼 注意力機制 準確度 | ||
本公開涉及一種觀點提取方法及裝置。該方法通過網絡模型實現,該網絡模型包括編碼模塊以及解碼模塊,方法包括:獲取待提取對象的特征信息;將特征信息輸入編碼模塊中進行處理,確定待提取對象的編碼信息;將編碼信息輸入解碼模塊中進行處理,確定待提取對象的觀點提取結果,其中,編碼模塊包括循環神經網絡,解碼模塊包括具有注意力機制的循環神經網絡。根據本公開實施例,能夠獲取待提取對象的特征信息,將特征信息輸入編碼模塊中進行處理,確定待提取對象的編碼信息,將編碼信息輸入解碼模塊中進行處理,確定待提取對象的觀點提取結果,通過利用網絡模型實現獲取待提取對象的觀點提取結果,提高了觀點提取結果的準確度。
技術領域
本公開涉及計算機技術領域,尤其涉及一種觀點提取方法及裝置。
背景技術
隨著社交網絡、移動互聯網的不斷普及,人們發布信息的成本越來越低,越來越多的用戶樂于在互聯網上分享自己的觀點,這些觀點對于輿情分析以及基于大數據的預測有著重要的意義。然而,相關技術中,觀點提取結果的準確度較低。
發明內容
有鑒于此,本公開提出了一種觀點提取方法及裝置,能夠準確地獲取觀點提取結果。
根據本公開的一方面,提供了一種觀點提取方法,所述方法通過網絡模型實現,所述網絡模型包括編碼模塊以及解碼模塊,所述方法包括:
獲取待提取對象的特征信息;
將所述特征信息輸入所述編碼模塊中進行處理,確定所述待提取對象的編碼信息;
將所述編碼信息輸入所述解碼模塊中進行處理,確定所述待提取對象的觀點提取結果,
其中,所述編碼模塊包括循環神經網絡,所述解碼模塊包括具有注意力機制的循環神經網絡。
在一種可能的實現方式中,所述網絡模型還包括嵌入模塊,
其中,獲取待提取對象的特征信息,包括:
確定所述待提取對象的多個初始信息;
將所述多個初始信息輸入所述嵌入模塊進行向量化處理,確定所述多個初始信息的向量信息;
將所述向量信息確定為所述特征信息。
在一種可能的實現方式中,所述編碼模塊包括第一隱藏層,所述特征信息包括T個編碼時序的特征信息,
其中,將所述特征信息輸入所述編碼模塊中進行處理,確定所述待提取對象的編碼信息,包括:
將所述T個編碼時序的特征信息輸入所述第一隱藏層中進行處理,確定所述待提取對象的T個編碼時序的編碼信息,
其中,T為正整數。
在一種可能的實現方式中,所述解碼模塊包括第二隱藏層和輸出層,所述輸出層輸出N個解碼時序的觀點提取結果,
其中,將所述編碼信息輸入所述解碼模塊中進行處理,確定所述待提取對象的觀點提取結果,包括:
將第i-1個解碼時序的隱藏層結果、第i-1個解碼時序的觀點提取結果以及第i-1個解碼時序的語義信息輸入到所述第二隱藏層中進行處理,確定第i個解碼時序的隱藏層結果;
根據所述第i個解碼時序的隱藏層結果以及所述T個編碼時序的編碼信息的相關度,分別確定針對所述第i個解碼時序的所述T個編碼時序的編碼信息的T個權重;
通過注意力調整函數對所述T個編碼時序的編碼信息以及所述T個權重進行處理,確定第i個解碼時序的語義信息;
將所述第i個解碼時序的語義信息、第i-1個解碼時序的觀點提取結果以及所述第i個解碼時序的隱藏層結果輸入到所述輸出層中進行處理,確定第i個解碼時序的觀點提取結果,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于優酷網絡技術(北京)有限公司,未經優酷網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810205252.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:點擊率預估方法、裝置、設備及存儲介質
- 下一篇:一種自動化搜索的方法





