[發明專利]一種智能問答的優化方法及裝置、存儲介質、終端在審
| 申請號: | 202210248099.1 | 申請日: | 2022-03-14 |
| 公開(公告)號: | CN114610853A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 譙軼軒 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/35;G06K9/62 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 518000 廣東省深圳市福田街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 問答 優化 方法 裝置 存儲 介質 終端 | ||
本發明公開了一種智能問答的優化方法及裝置、存儲介質、終端,涉及自然語言處理技術領域,主要目的在于解決現有問答模型輸出答案是否準確與初步提取的文章緊密相關,且模型部署困難,從而導致現有問答系統性能較差的問題。包括:接收待回答問題并計算與所述待回答問題對應的問題向量;獲取預設短語庫中的多個短語向量;基于所述問題向量和所述短語向量,利用預先訓練的問答模型計算短語與待回答問題之間的匹配概率;根據所述匹配概率輸出所述待回答問題的答案。主要用于智能問答系統。
技術領域
本申請涉及自然語言處理技術領域,特別是涉及一種智能問答的優化方法及裝置、存儲介質、終端。
背景技術
隨著大數據時代的到來和人工智能技術的飛速發展,人工智能設備已經遍布在各行各業,這些設備能夠通過訓練的模型實現語音識別、圖像處理、翻譯、文本分類等多種功能,智能問答就是其中之一。智能問答系統能夠根據海量的語料信息,通過自然語言處理技術進行整理劃分得到有序的知識結構,并針對問題進行快速的檢索,獲取問題的答案,能夠滿足各個領域的信息獲取需求。
對于智能問答的實現方法,通常是通過收集大量的訓練樣本數據訓練問答模型,問答模型識別輸入的問題智能地輸出問題的答案,具體地,問答模型主要是先針對給定的問題,從海量知識庫中檢索出于問題相關的文章,再從所有文章中提取出最符合給定問題的答案。也就是說,現有的問答系統輸出的答案是否準確很大程度上取決于初步提取到的文章是否準確,且問答模型的基本處理單元為文章,但由于問答系統處理速度與輸入長度的平方成正比關系,從而使得現有問答模型部署困難且處理時間較長,從而導致現有問答系統性能較差的問題。
發明內容
有鑒于此,本發明提供一種智能問答的優化方法及裝置、存儲介質、終端,主要目的在于解決現有問答模型輸出答案是否準確與初步提取的文章緊密相關,且模型部署困難,從而導致現有問答系統性能較差的問題。
依據本發明一個方面,提供了一種智能問答的優化方法,包括:
接收待回答問題并計算與所述待回答問題對應的問題向量,所述問題向量為包含所述待回答問題的語義信息的向量;
獲取預設短語庫中的多個短語向量,各個所述短語向量為包含短語對應的上下文語義信息的向量;
基于所述問題向量和所述短語向量,利用預先訓練的問答模型計算短語與待回答問題之間的匹配概率,所述匹配概率用于標識所述短語作為所述待回答問題的答案的匹配程度;
根據所述匹配概率輸出所述待回答問題的答案。
進一步地,所述獲取預設短語庫中的多個短語向量之前,所述方法還包括:
獲取文本庫中的多個文章并按照短語粒度將各個所述文章進行劃分,得到多個短語,每個短語在所屬文章中對應有起始位置和結束位置;
將各個所述文章按照字符粒度輸入第一BERT模型進行計算,得到多個字符向量;
根據所述起始位置對應的起始字符向量和所述結束位置對應的結束字符向量進行拼接,得到所述短語的短語向量;
基于所述多個文章包含的短語對應的短語向量生成所述預設短語庫。
進一步地,所述接收待回答問題并計算與所述待回答問題對應的問題向量之前,所述方法還包括:
獲取樣本問題和樣本問題答案;
提取樣本向量集合,所述樣本向量集合中包含有多個樣本字符向量,且各個所述樣本字符向量為基于所述樣本問題答案所屬文章生成的;
將所述樣本問題依次輸入第二BERT模型和第三BERT模型進行計算,分別得到問題起始向量和問題結束向量;
利用所述起始向量和所述問題結束向量進行拼接,得到樣本問題向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210248099.1/2.html,轉載請聲明來源鉆瓜專利網。





