[發明專利]問答匹配系統和方法及問答處理設備和介質有效
| 申請號: | 201811340892.4 | 申請日: | 2018-11-12 |
| 公開(公告)號: | CN111177328B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 方晗吟;劉洋;蔣冠軍 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/33;G06N3/0464 |
| 代理公司: | 北京展翼知識產權代理事務所(特殊普通合伙) 11452 | 代理人: | 屠長存 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問答 匹配 系統 方法 處理 設備 介質 | ||
1.一種問答匹配系統,用于針對用戶的問詢來提供匹配的答案,其特征在于,該系統包括卷積神經網絡,所述卷積神經網絡包括:
分別處于問詢側和答案側的詞嵌入層,被配置為在該層利用預訓練的用于表述基礎特征的統一詞向量來對輸入的問詢和對應于該問詢的至少一個備選答案之一分別進行初始化,以得到所述問詢和相應備選答案的向量表述;
分別處于問詢側和答案側的卷積層,被配置為對所述的問詢的特征表述和所述相應備選答案的特征表述進行卷積操作以提取特征;以及
全連接層,經過卷積層卷積之后的問詢側和答案側的卷積結果均輸入全連接層,并從全連接層輸出匹配結果,
其中,所述問詢側和答案側的兩個詞嵌入層共享預訓練的所述詞向量,而所述問詢側和答案側的兩個卷積層不共享配置參數,
所述問答匹配系統還包括數據集構建模塊,該數據集構建模塊被配置為從已有的問答數據中獲取問詢和與其對應的最佳答案并組成一對正樣本,并將從問答數據中非該問詢的答案中隨機采樣到的答案作為負樣本,還從問答數據中采樣與該問詢的字面相似的答案作為負樣本,從而構造出該問詢對應的數據集,并將構造的數據集應用于所述卷積神經網絡,
所述問答匹配系統還包括詞向量預訓練模塊,該詞向量預訓練模塊被配置為收集用戶輸入的問詢數據作為訓練詞向量的一個語料來源,然后結合作為訓練詞向量的另一個語料來源的百科數據,采用詞向量嵌入方法來訓練得到詞向量。
2.根據權利要求1所述的問答匹配系統,其特征在于,所述問答匹配系統利用預先構造的數據集中的正負樣本作為訓練數據來端到端地訓練卷積神經網絡模型,由此得到與用戶的問詢匹配的答案。
3.根據權利要求1所述的問答匹配系統,其特征在于,所述詞向量預訓練模塊在收集用戶問詢時,根據查詢次數來過濾問詢。
4.一種問答匹配方法,用于針對用戶的問詢來提供匹配的答案,其特征在于,該方法基于卷積神經網絡,包括:
利用預訓練的用于表述基礎特征的統一詞向量來對用戶輸入的問詢和對應于該問詢的至少一個備選答案之一分別進行初始化,以得到所述問詢和相應備選答案的向量表述;
對所述問詢的特征表述和所述相應備選答案的特征表述分別進行卷積操作以提取特征;以及
將所述問詢的特征表述和所述相應備選答案的特征表述的卷積結果映射到樣本標記空間,從而得到所述問詢的匹配結果,
其中,所述問詢的特征表述的卷積操作不與所述相應備選答案的特征表述的卷積操作共享配置參數;
所述問答匹配方法還包括:
從已有的問答數據中獲取問詢和與其對應的最佳答案并組成一對正樣本,并將從問答數據中非該問詢的答案中隨機采樣到的答案作為負樣本,還從問答數據中采樣與該問詢的字面相似的答案作為負樣本,從而構造出該問詢對應的數據集,并將構造的數據集應用于所述卷積神經網絡;
收集用戶輸入的問詢數據作為訓練詞向量的一個語料來源,然后結合作為訓練詞向量的另一個語料來源的百科數據,采用詞向量嵌入方法來訓練得到所述詞向量。
5.根據權利要求4所述的問答匹配方法,其特征在于,所述問答匹配方法利用預先構造的數據集中的正負樣本作為訓練數據來端到端地訓練卷積神經網絡模型,由此得到與用戶的問詢匹配的答案。
6.根據權利要求4所述的問答匹配方法,其特征在于,在收集用戶的問詢時,根據查詢次數來過濾問詢。
7.一種問答處理設備,包括:
處理器;以及
存儲器,其上存儲有可執行代碼,當所述可執行代碼被所述處理器執行時,使所述處理器執行如權利要求4~6中任何一項所述的方法。
8.一種非暫時性機器可讀存儲介質,其上存儲有可執行代碼,當所述可執行代碼被語音處理設備的處理器執行時,使所述處理器執行如權利要求4~6中任何一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811340892.4/1.html,轉載請聲明來源鉆瓜專利網。





