[發明專利]答案篩選方法、裝置、終端設備和計算機可讀存儲介質有效
| 申請號: | 202011343387.2 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112131354B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 熊智;江琳;陳科第;張銓;王耿鑫;龐磊;郭志偉 | 申請(專利權)人: | 廣州華多網絡科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/583;G06F16/953;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 郭帥 |
| 地址: | 511442 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 答案 篩選 方法 裝置 終端設備 計算機 可讀 存儲 介質 | ||
1.一種答案篩選方法,其特征在于,所述方法包括:
獲取待測試的問題答案數據,其中,所述問題答案數據包括多個問題和答案,每一個所述問題對應一個或多個所述答案,每一個所述問題與對應的任一個所述答案形成一個問題答案對;
計算每一個所述問題答案對中問題與答案之間的文本得分,得到所述問題答案對的第一得分;
檢測每一個所述問題答案對中答案的錯誤率占比,根據所述錯誤率占比確定所述問題答案對的第二得分;
統計每一個所述問題答案對中答案的長度值,根據所述長度值計算所述問題答案對的第三得分;
計算每一個所述問題答案對中答案的圖像得分,得到問題答案對的第四得分;
根據所述第一得分、所述第二得分、所述第三得分和所述第四得分計算出每一個所述問題答案對的最終得分值;
根據多個所述最終得分值篩選出每一個問題對應的最優答案;
所述問題包括問題文本,所述答案包括答案文本和答案圖像;每一個所述問題答案對包括問題答案文本對和/或問題答案圖像對;
計算每一個所述問題答案對中問題與答案之間的文本得分,得到所述問題答案對的第一得分的步驟中,包括:
當一個所述問題答案對為問題答案文本對,或為所述問題答案文本對和所述問題答案圖像對時,將所述問題答案文本對輸入文本特征提取模型得到問題文本的特征向量與答案文本的特征向量,并將所述問題文本的特征向量與所述答案文本的特征向量進行內積計算,得到所述問題答案對的第一得分;其中所述文本特征提取模型是采用標記的文本數據對第一深度神經網絡進行訓練得到的,所述文本數據包括多個問題文本和答案文本,每一個所述問題文本對應一個或多個所述答案文本,每一個所述問題文本與對應的任一個所述答案文本形成一個問題答案文本對。
2.根據權利要求1所述的方法,其特征在于,所述錯誤率占比包括錯別字占比,在檢測每一個所述問題答案對中答案的錯誤率占比,計算得到所述問題答案對的第二得分的步驟中,包括:
當一個所述問題答案對為問題答案文本對,或為所述問題答案文本對和所述問題答案圖像對時,將所述問題答案文本對中的答案文本采用SymSpell方法檢測錯別字的個數,并計算出錯別字占比,根據所述錯別字占比計算得到所述問題答案對的第二得分;
或
當一個所述問題答案對為所述問題答案圖像對時,采用第二預設值記為所述問題答案對的第二得分。
3.根據權利要求1所述的方法,其特征在于,統計每一個所述問題答案對中答案的長度值,根據所述長度值計算問題答案對的第三得分的步驟中,包括:
當一個所述問題答案對為問題答案文本對,或為所述問題答案文本對和所述問題答案圖像對時,統計所述問題答案文本對中的答案文本的長度;
采用預設長度來對所述答案文本的長度進行分段,根據分段結果對所述答案文本進行評分,得到所述問題答案對的第三得分;
或
當一個所述問題答案對為所述問題答案圖像對時,采用第三預設值作為所述問題答案對的第三得分。
4.根據權利要求2或3所述的方法,其特征在于,計算每一個所述問題答案對中答案的圖像得分,得到問題答案對的第四得分的步驟中,包括:
當一個所述問題答案對為問題答案圖像對,或為所述問題答案文本對和所述問題答案圖像對時,將所述問題答案圖像對中的答案圖像輸入圖像分類模型,得到所述答案圖像的分類結果;其中所述圖像分類模型是采用標記的圖像數據對第二深度神經網絡進行訓練得到的,所述圖像數據包括多種圖像,且數量為多張;
當所述答案圖像為普通圖像時,得到第一圖像得分;
采用第三深度神經網絡對所述答案圖像進行文字提取,得到對應的答案文本;
將所述問題答案圖像對中的問題文本與所述對應的答案文本輸入所述文本特征提取模型,得到所述問題文本的特征向量與所述對應的答案文本的特征向量,并將所述問題文本的特征向量與所述對應的答案文本的特征向量進行內積計算,將計算結果記為第二圖像得分;
根據所述第一圖像得分和第二所述圖像得分,計算得出所述問題答案對的第四得分;
或
當一個所述問題答案對為所述問題答案文本對時,采用第四預設值作為所述問題答案對的第四得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州華多網絡科技有限公司,未經廣州華多網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011343387.2/1.html,轉載請聲明來源鉆瓜專利網。





