[發(fā)明專利]基于問答系統(tǒng)的信息處理方法、介質(zhì)、裝置和計(jì)算設(shè)備在審
| 申請?zhí)枺?/td> | 202111104891.1 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN113761107A | 公開(公告)日: | 2021-12-07 |
| 發(fā)明(設(shè)計(jì))人: | 馮旻偉;傅婧蕓;尹競成;阮良 | 申請(專利權(quán))人: | 杭州網(wǎng)易智企科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/332;G06F16/35 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 宋興;劉芳 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 問答 系統(tǒng) 信息處理 方法 介質(zhì) 裝置 計(jì)算 設(shè)備 | ||
本公開的實(shí)施方式提供了一種基于問答系統(tǒng)的信息處理方法。該方法包括:獲取知識庫中待壓縮的句向量;對句向量進(jìn)行信號分解,得到句向量包含的目標(biāo)低頻分量;在知識庫中,將句向量替換為目標(biāo)低頻分量。該方法通過信號分解出句向量包含的低頻分量的方式,在句向量壓縮的同時(shí)保留了句向量中大部分的有效信息,從而顯著地降低了句向量壓縮對問答系統(tǒng)中知識庫的表達(dá)能力的影響,提高了基于知識庫進(jìn)行問答的準(zhǔn)確性,有利于問答系統(tǒng)為用戶返回更優(yōu)的答案,為用戶帶來了更好的體驗(yàn)。此外,本公開的實(shí)施方式還提供了一種介質(zhì)、裝置和計(jì)算設(shè)備。
技術(shù)領(lǐng)域
本公開的實(shí)施方式涉及自然語言處理技術(shù)領(lǐng)域,更具體地,本公開的實(shí)施方式涉及一種基于問答系統(tǒng)的信息處理方法、介質(zhì)、裝置和計(jì)算設(shè)備。
背景技術(shù)
本部分旨在為權(quán)利要求書中陳述的本公開的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
在問答系統(tǒng)中,例如智能客服系統(tǒng),知識庫是問答系統(tǒng)的核心模塊,由許多問題-答案對構(gòu)成。在實(shí)際應(yīng)用中,系統(tǒng)會將訪客的請求與知識庫中的每一個(gè)問題進(jìn)行相似度匹配,并將相似度最高的問題的答案返回給訪客。上述相似度匹配是在向量空間中完成的,即:需要把知識庫中的所有問題都轉(zhuǎn)換為句向量,同時(shí)將訪客請求也轉(zhuǎn)換為句向量,最后對兩個(gè)句向量計(jì)算相似度。為了能夠準(zhǔn)確完整表示某個(gè)語句涵蓋的信息,在計(jì)算條件允許的情況下,句向量長度往往會設(shè)定得盡可能長一些,同時(shí),知識庫需要盡可能涵蓋全部常用問答對,即知識庫里邊的知識點(diǎn)數(shù)量較多,這帶來了巨大的計(jì)算開銷和存儲空間成本。
目前,對知識庫中的句向量進(jìn)行壓縮是降低問答系統(tǒng)的計(jì)算開銷和存儲空間成本的關(guān)鍵技術(shù)之一。在對句向量進(jìn)行壓縮時(shí),可采用基于聚類和主成分分析的壓縮方法:先通過聚類對句向量矩陣的行數(shù)進(jìn)行降維,減少需要存儲的句向量個(gè)數(shù),其中句向量矩陣中每一行為一個(gè)句向量;再用主成分分析方法對句向量的列數(shù)進(jìn)行降維,減少單個(gè)句向量的長度。
然而,采用上述方法雖然能有效降低問答系統(tǒng)的計(jì)算開銷和存儲空間成本,但返回給訪客的答案往往不是最優(yōu)的。
發(fā)明內(nèi)容
在本上下文中,本公開的實(shí)施方式期望提供一種基于問答系統(tǒng)的信息處理方法、介質(zhì)、裝置和計(jì)算設(shè)備。
在本公開實(shí)施方式的第一方面中,提供了一種基于問答系統(tǒng)的信息處理方法,應(yīng)用于對問答系統(tǒng)的知識庫中的句向量進(jìn)行壓縮處理,包括:獲取知識庫中待壓縮的句向量;對句向量進(jìn)行信號分解,得到句向量包含的目標(biāo)低頻分量;在知識庫中,將句向量替換為目標(biāo)低頻分量。
在本公開的一個(gè)實(shí)施例中,對句向量進(jìn)行信號分解,得到句向量包含的目標(biāo)低頻分量,包括:對句向量進(jìn)行單層或多層的信號分解,得到目標(biāo)低頻分量,其中,在多次的信號分解中,第一層的分解對象為句向量,剩余層的分解對象為上一層分解得到的低頻分量。
在本公開的又一實(shí)施例中,得到目標(biāo)低頻分量,包括:響應(yīng)于句向量的信號分解滿足分解結(jié)束條件,得到目標(biāo)低頻分量,其中,分解結(jié)束條件包括如下至少一種:分解次數(shù)等于目標(biāo)分解次數(shù)、壓縮率大于或等于目標(biāo)壓縮率。
在本公開的又一個(gè)實(shí)施例中,基于問答系統(tǒng)的信息處理方法還包括:根據(jù)壓縮指標(biāo)和/或句向量的特征,確定分解結(jié)束條件。
在本公開的又一個(gè)實(shí)施例中,句向量的一層信號分解通過以下方式實(shí)現(xiàn):對當(dāng)前層的分解對象進(jìn)行小波分解,得到當(dāng)前層的分解對象包含的低頻分量。
在本公開的又一個(gè)實(shí)施例中,對當(dāng)前層的分解對象進(jìn)行小波分解,得到當(dāng)前層的分解對象包含的低頻分量,包括:根據(jù)選取的小波函數(shù),確定低通濾波器的濾波器系數(shù)序列;對當(dāng)前層的分解對象進(jìn)行邊界延拓;對邊界延拓后的當(dāng)前層的分解對象進(jìn)行降采樣;基于濾波器系數(shù)序列,對降采樣后的當(dāng)前層的分解對象進(jìn)行小波分解,得到當(dāng)前層的分解對象包含的低頻分量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州網(wǎng)易智企科技有限公司,未經(jīng)杭州網(wǎng)易智企科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111104891.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于生成動態(tài)幫助文檔的方法和系統(tǒng)
- 建立問答文本評價(jià)模型與評價(jià)問答文本的方法、裝置
- 基于學(xué)生問答方式的在線教育系統(tǒng)
- 一種問答輸入的智能提示方法、裝置和終端設(shè)備
- 一種通用的智能問答自動化運(yùn)維系統(tǒng)及方法
- 自動問答方法、裝置、可讀存儲介質(zhì)及電子設(shè)備
- 一種基于知識圖譜的智能問答引擎及其實(shí)現(xiàn)方法
- 基于人工智能技術(shù)的類腦問答系統(tǒng)
- 一種基于語義分析技術(shù)的專業(yè)制度檔案問答機(jī)器人系統(tǒng)
- 一種視覺問答方法、系統(tǒng)及服務(wù)器





