[發明專利]基于深度學習的問詢信息識別方法、裝置及存儲介質有效
| 申請號: | 202010804145.2 | 申請日: | 2020-08-12 |
| 公開(公告)號: | CN111680501B | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 魯夢平;吳漢杰;陳毅臻;戴云峰;田帥;師婷婷 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F16/35 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 李文淵 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 問詢 信息 識別 方法 裝置 存儲 介質 | ||
本申請涉及一種基于深度學習的問詢信息識別方法、裝置及存儲介質。所述方法包括:獲取待識別問詢信息;待識別問詢信息中包含至少一個提問詞;獲取提問詞的詞向量;獲取詞向量在待識別問詢信息中的影響系數;根據影響系數對詞向量進行加權整合,得到目標詞向量;從待識別問詢信息中提取出用于對有效性識別結果進行評價的有效性評價特征;結合目標詞向量和有效性評價特征對待識別問詢信息進行有效性分類,輸出待識別問詢信息的有效性識別結果。上述方案,基于深度學習融合詞向量以及有效性評價特征,以對待識別問詢信息進行有效性分類,能得到準確的有效性識別結果。
技術領域
本申請涉及網絡技術領域,特別是涉及一種基于深度學習的問詢信息識別方法、裝置、計算機設備和存儲介質。
背景技術
在社區運營、客戶咨詢等服務中,QA(常見問題及解答)作為用戶之間互動溝通的重要方式,帶來了大量有價值的信息,給用戶帶來了諸多便利。用戶提問所受約束較小,隨意組織的問詢信息會導致其他人無法準確地理解所問詢的問題,不僅浪費其他人的時間,而且很難幫助到問詢者,甚至會引起不適。因此,識別有效的、高質量的問詢信息就顯得很有價值。
目前,存在一些通過深度學習模型來識別問詢信息是否有效的方法,但是這些方法中的模型架構較為簡單,導致無法準確地識別有效問詢信息。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠準確地識別有效問詢信息的基于深度學習的問詢信息識別方法、裝置、計算機設備和存儲介質。
一種基于深度學習的問詢信息識別方法,所述方法包括:獲取待識別問詢信息;所述待識別問詢信息中包含至少一個提問詞;獲取所述提問詞的詞向量;獲取所述詞向量在所述待識別問詢信息中的影響系數;根據所述影響系數對所述詞向量進行加權整合,得到目標詞向量;從所述待識別問詢信息中提取出用于對有效性識別結果進行評價的有效性評價特征;結合所述目標詞向量和所述有效性評價特征對所述待識別問詢信息進行有效性分類,輸出所述待識別問詢信息的有效性識別結果。
在一個實施例中,所述結合所述目標詞向量和所述評價特征向量對所述待識別問詢信息進行有效性分類,包括:對所述目標詞向量和所述評價特征向量進行向量拼接,得到目標向量;由預先訓練的提問分類模型根據所述目標向量對所述待識別問詢信息進行有效性分類;所述提問分類模型使用二分類交叉熵損失函數訓練得到。
在一個實施例中,所述獲取所述提問詞的詞向量,包括:對所述待識別問詢信息進行以下至少一項清洗處理:繁簡轉換、標點符號轉換、空白字符剔除和錯別字糾正;對經過清洗處理的所述待識別問詢信息進行分詞處理,根據分詞處理結果得到所述提問詞;根據預訓練的詞向量轉換模型對所述提問詞進行向量轉換,得到所述提問詞對應的詞向量。
一種基于深度學習的問詢信息識別裝置,所述裝置包括:問詢信息獲取模塊,用于獲取待識別問詢信息;所述待識別問詢信息中包含至少一個提問詞;詞向量獲取模塊,用于獲取所述提問詞的詞向量;影響系數確定模塊,用于獲取所述詞向量在所述待識別問詢信息中的影響系數;詞向量確定模塊,用于根據所述影響系數對所述詞向量進行加權整合,得到目標詞向量;評價特征提取模塊,用于從所述待識別問詢信息中提取出用于對有效性識別結果進行評價的有效性評價特征;有效性識別模塊,用于結合所述目標詞向量和所述有效性評價特征對所述待識別問詢信息進行有效性分類,輸出所述待識別問詢信息的有效性識別結果。
在一個實施例中,所述裝置包括:詞向量處理模型輸入模塊,用于將所述待識別問詢信息輸入預先訓練的詞向量處理模型;所述詞向量處理模型獲取所述詞向量;獲取所述影響系數;根據所述影響系數對所述詞向量進行加權整合,得到所述目標詞向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010804145.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便捷式廢液收集處理裝置
- 下一篇:一種電磁鎖止電表及鎖止控制方法





