[發(fā)明專利]一種問答系統(tǒng)的更新處理方法和裝置在審
| 申請?zhí)枺?/td> | 202011503415.2 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112507100A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計)人: | 古桂元;焦振宇;孫叔琦;常月;李婷婷 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/23;G06F16/31 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 問答 系統(tǒng) 更新 處理 方法 裝置 | ||
1.一種問答系統(tǒng)的更新處理方法,包括:
獲取更新后的問答集;
將更新后的問答集與原有問答集的各分塊進(jìn)行問答對的比較,確定未發(fā)生變化的分塊和發(fā)生變化的分塊;
獲取發(fā)生變化的分塊所包含各問題的特征數(shù)據(jù),建立該分塊對應(yīng)的索引文件并將所述特征數(shù)據(jù)加入更新后的訓(xùn)練產(chǎn)出集;以及,
保留未發(fā)生變化的分塊對應(yīng)的索引文件和特征數(shù)據(jù),將所述特征數(shù)據(jù)加入更新后的訓(xùn)練產(chǎn)出集。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述各分塊的標(biāo)識與分塊所包含問答對的標(biāo)識存在綁定關(guān)系;
所述將更新后的問答集與原有問答集的各分塊進(jìn)行問答對的比較包括:
依據(jù)更新后的問答集所包含的各問答對的標(biāo)識,在原有問答集中查詢是否存在與該標(biāo)識一致的問答對,并確定與該標(biāo)識一致的問答對綁定的分塊的標(biāo)識。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述確定未發(fā)生變化的分塊和發(fā)生變化的分塊包括:
若在原有問答集中查詢到標(biāo)識一致的問答對,則將該問答對在所綁定分塊中標(biāo)記為未發(fā)生變化;若在原有問答集中未找到標(biāo)識一致的問答對,則將該問答對分配至新建的分塊中;
所述比較結(jié)束后,若分塊中所有問答對均未發(fā)生變化,則將該分塊確定為未發(fā)生變化的分塊;將分塊中未標(biāo)記的問答對刪除,并將存在部分問答對刪除的分塊與新建的分塊確定為發(fā)生變化的分塊。
4.根據(jù)權(quán)利要求2或3所述的方法,其中,所述問答對的標(biāo)識包括:對所述問答對進(jìn)行信息摘要算法處理得到的信息摘要值。
5.根據(jù)權(quán)利要求3所述的方法,該方法還包括:
若分塊中所有問答對均被刪除,則將該分塊、該分塊對應(yīng)的綁定關(guān)系和索引文件刪除。
6.一種問答系統(tǒng)的更新處理裝置,包括:
更新獲取模塊,用于獲取更新后的問答集;
分塊處理模塊,將更新后的問答集與原有問答集的各分塊進(jìn)行問答對的比較,確定未發(fā)生變化的分塊和發(fā)生變化的分塊;
更新處理模塊,用于獲取發(fā)生變化的分塊所包含各問題的特征數(shù)據(jù),建立該分塊對應(yīng)的索引文件并將所述特征數(shù)據(jù)加入更新后的訓(xùn)練產(chǎn)出集;
復(fù)用處理模塊,用于保留未發(fā)生變化的分塊對應(yīng)的索引文件和特征數(shù)據(jù),將所述特征數(shù)據(jù)加入更新后的訓(xùn)練產(chǎn)出集。
7.根據(jù)權(quán)利要求6所述的裝置,其中,所述各分塊的標(biāo)識與分塊所包含問答對的標(biāo)識存在綁定關(guān)系;
所述分塊處理模塊包括:
比較子模塊,用于依據(jù)更新后的問答集所包含的各問答對的標(biāo)識,在原有問答集中查詢是否存在與該標(biāo)識一致的問答對,并確定與該標(biāo)識一致的問答對綁定的分塊的標(biāo)識。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述分塊處理模塊還包括:
標(biāo)記子模塊,用于若所述比較子模塊在原有問答集中查詢到標(biāo)識一致的問答對,則將該問答對在所綁定分塊中標(biāo)記為未發(fā)生變化;
分塊子模塊,用于若所述比較子模塊在原有問答集中未找到標(biāo)識一致的問答對,則將該問答對分配至新建的分塊中;
確定子模塊,用于在所述比較子模塊針對更新后的問答集所包含的各問答對都查詢結(jié)束后,若分塊中所有問答對均未發(fā)生變化,則將該分塊確定為未發(fā)生變化的分塊;將分塊中未標(biāo)記的問答對刪除,并將存在部分問答對刪除的分塊與新建的分塊確定為發(fā)生變化的分塊。
9.根據(jù)權(quán)利要求7或8所述的裝置,其中,所述問答對的標(biāo)識包括:對所述問答對進(jìn)行信息摘要算法處理得到的信息摘要值。
10.根據(jù)權(quán)利要求8所述的裝置,還包括:
刪除處理模塊,用于若分塊中所有問答對均被刪除,則將該分塊、該分塊對應(yīng)的綁定關(guān)系和索引文件刪除。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011503415.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





