[發明專利]評論文本數據的處理方法、裝置及存儲介質在審
| 申請號: | 202011240954.1 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112328793A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 王鵬程;彭力;陳帥 | 申請(專利權)人: | 北京小米松果電子有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/111;G06F40/247 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曾堯 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 文本 數據 處理 方法 裝置 存儲 介質 | ||
1.一種評論文本數據的處理方法,其特征在于,包括:
將從互聯網平臺獲取到的目標物品的用戶評論文本數據輸入觀點抽取模型,得到所述觀點抽取模型輸出的詞語集合,以及所述詞語集合中每一詞語的首尾字符在所述用戶評論文本數據中的位置下標,所述詞語集合包括表征所述目標物品的特征要素的特征詞和表征用戶針對所述特征要素的觀點詞;
基于所述詞語集合中每一詞語的首尾字符位置下標,從所述詞語集合中確定所述特征詞和所述觀點詞之間字符間距小于預設閾值的候選二元詞組,得到候選二元詞組集合;
將所述候選二元詞組集合中每一所述候選二元詞組的所述特征詞的首尾字符位置下標和所述觀點詞的首尾字符位置下標,以及所述用戶評論文本數據輸入判斷模型,得到所述判斷模型輸出的目標二元詞組集合;
將所述目標二元詞組集合中的目標二元詞組均作為所述用戶評論文本數據的評論觀點數據。
2.根據權利要求1所述的方法,其特征在于,在所述將所述候選二元詞組集合中每一所述候選二元詞組的所述特征詞的首尾字符位置下標和所述觀點詞的首尾字符位置下標,以及所述用戶評論文本數據輸入判斷模型之前,包括:
針對每一所述候選二元詞組,計算所述候選二元詞組中所述特征詞和所述觀點詞的特征信息;
所述將所述候選二元詞組集合中每一所述候選二元詞組的所述特征詞的首尾字符位置下標和所述觀點詞的首尾字符位置下標,以及所述用戶評論文本數據輸入判斷模型,包括:
將所述候選二元詞組集合中每一所述候選二元詞組的所述特征詞的首尾字符位置下標和所述觀點詞的首尾字符位置下標、每一所述候選二元詞組的所述特征信息以及所述用戶評論文本數據輸入所述判斷模型。
3.根據權利要求2所述的方法,其特征在于,所述判斷模型用于:
通過所述判斷模型中第一BERT模塊確定所述用戶評論文本數據的CLS符號以及所述用戶評論文本數據對應的第一特征向量;
針對每一所述候選二元詞組,根據所述第一特征向量和該候選二元詞組的所述特征詞的首尾字符位置下標和所述觀點詞的首尾字符位置下標,確定該候選二元詞組的所述特征詞的首尾向量和所述觀點詞的首尾向量;
將所述CLS符號、該候選二元詞組的所述特征詞的首尾向量和所述觀點詞的首尾向量、該候選二元詞組的所述特征信息進行拼接,得到該候選二元詞組的第一全連接向量;
對該候選二元詞組的所述第一全連接向量進行二分類處理,以確定該候選二元詞組是否為所述目標二元詞組。
4.根據權利要求1-3中任一項所述的方法,其特征在于,在所述將所述目標二元詞組集合中的目標二元詞組均作為所述用戶評論文本數據的評論觀點數據之前,包括:
將所述目標二元詞組集合中每一所述目標二元詞組的目標特征詞的首尾字符位置下標和目標觀點詞的首尾字符位置下標,以及所述用戶評論文本數據輸入語義傾向模型,得到所述語義傾向模型輸出的表征每一所述目標二元詞組的極性類別;
所述將所述目標二元詞組集合中的目標二元詞組均作為所述用戶評論文本數據的評論觀點數據,包括:
將所述目標二元詞組集合中每一目標二元詞組和該目標二元詞組的所述極性類別作為所述用戶評論文本數據的所述評論觀點數據。
5.根據權利要求4所述的方法,其特征在于,所述方法應用于互聯網平臺,所述方法還包括:
將所述評論觀點數據中的所述極性類別作為所述用戶評論文本數據的一級標簽,根據所述一級標簽建立第一評論類目,并將所述用戶評論文本數據顯示在所述互聯網平臺頁面上對應的所述第一評論類目下;或者,
將所述評論觀點數據中的所述目標二元詞組作為所述用戶評論文本數據的二級標簽,根據所述二級標簽建立第二評論類目,并將所述用戶評論文本數據顯示在所述互聯網平臺頁面上對應的所述第二評論類目下。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米松果電子有限公司,未經北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011240954.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種復合輕質混凝土配制方法
- 下一篇:一種光伏組串發電效能優化系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





