[發(fā)明專利]一種用于對(duì)話交互系統(tǒng)的數(shù)據(jù)處理方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710017117.4 | 申請(qǐng)日: | 2017-01-11 |
| 公開(公告)號(hào): | CN106844587B | 公開(公告)日: | 2019-11-08 |
| 發(fā)明(設(shè)計(jì))人: | 包強(qiáng) | 申請(qǐng)(專利權(quán))人: | 北京光年無限科技有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332 |
| 代理公司: | 北京聿華聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 11611 | 代理人: | 李哲偉;張文娟 |
| 地址: | 100000 北京市石景山區(qū)石景山*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 對(duì)話 交互 系統(tǒng) 數(shù)據(jù)處理 方法 裝置 | ||
1.一種用于對(duì)話交互系統(tǒng)的數(shù)據(jù)處理方法,其特征在于,包括:
對(duì)話交互數(shù)據(jù)獲取步驟,獲取用戶輸入的對(duì)話交互數(shù)據(jù)并解析,生成所述對(duì)話交互數(shù)據(jù)對(duì)應(yīng)的候選答案集合;
最相似問題確定步驟,計(jì)算所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度,并根據(jù)各個(gè)問題的相似度確定最相似問題,所述預(yù)設(shè)問題答案集合中問題與其對(duì)應(yīng)答案的相關(guān)度滿足設(shè)定的高相關(guān)度標(biāo)準(zhǔn);
答案生成步驟,獲取所述預(yù)設(shè)問題答案集合中所述最相似問題的答案,并計(jì)算所述最相似問題的答案與所述候選答案集合中各個(gè)答案的相似度,根據(jù)所述候選答案集合中各個(gè)答案的相似度從所述候選答案集合中確定出相似度最高的答案并輸出。
2.如權(quán)利要求1所述的方法,其特征在于,在所述最相似問題確定步驟中,計(jì)算所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度的步驟包括:
對(duì)所述對(duì)話交互數(shù)據(jù)進(jìn)行分詞處理,獲取所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的詞向量;
根據(jù)所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的詞向量及其權(quán)重,計(jì)算所述對(duì)話交互數(shù)據(jù)的句向量;
獲取所述預(yù)設(shè)問題答案集合中各個(gè)問題的句向量,計(jì)算所述對(duì)話交互數(shù)據(jù)的句向量與預(yù)設(shè)問題答案集合中各個(gè)問題的句向量的相似度,得到所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度。
3.如權(quán)利要求2所述的方法,其特征在于,根據(jù)tf-idf算法計(jì)算所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的權(quán)重。
4.如權(quán)利要求1~3中任一項(xiàng)所述的方法,其特征在于,在所述答案生成步驟中,如果所述最相似問題的答案與所述候選答案集合中各個(gè)答案的相似度均小于預(yù)設(shè)相似度閾值,則對(duì)所述候選答案集合進(jìn)行聚類迭代,確定所述候選答案集合中與所述對(duì)話交互數(shù)據(jù)最相關(guān)的答案并輸出。
5.一種用于對(duì)話交互系統(tǒng)的數(shù)據(jù)處理裝置,其特征在于,包括:
對(duì)話交互數(shù)據(jù)獲取模塊,其用于獲取用戶輸入的對(duì)話交互數(shù)據(jù)并解析,生成所述對(duì)話交互數(shù)據(jù)對(duì)應(yīng)的候選答案集合;
最相似問題確定模塊,其用于計(jì)算所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度,并根據(jù)各個(gè)問題的相似度確定最相似問題,所述預(yù)設(shè)問題答案集合中問題與其對(duì)應(yīng)答案的相關(guān)度滿足設(shè)定的高相關(guān)度標(biāo)準(zhǔn);
答案生成模塊,其用于獲取所述預(yù)設(shè)問題答案集合中所述最相似問題的答案,并計(jì)算所述最相似問題的答案與所述候選答案集合中各個(gè)答案的相似度,根據(jù)所述候選答案集合中各個(gè)答案的相似度從所述候選答案集合中確定出相似度最高的答案并輸出。
6.如權(quán)利要求5所述的裝置,其特征在于,所述最相似問題確定模塊配置為根據(jù)如下步驟計(jì)算所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度:
對(duì)所述對(duì)話交互數(shù)據(jù)進(jìn)行分詞處理,獲取所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的詞向量;
根據(jù)所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的詞向量及其權(quán)重,計(jì)算所述對(duì)話交互數(shù)據(jù)的句向量;
獲取所述預(yù)設(shè)問題答案集合中各個(gè)問題的句向量,計(jì)算所述對(duì)話交互數(shù)據(jù)的句向量與預(yù)設(shè)問題答案集合中各個(gè)問題的句向量的相似度,得到所述對(duì)話交互數(shù)據(jù)與預(yù)設(shè)問題答案集合中各個(gè)問題的相似度。
7.如權(quán)利要求6所述的裝置,其特征在于,所述最相似問題確定模塊配置為根據(jù)tf-idf算法計(jì)算所述對(duì)話交互數(shù)據(jù)中各個(gè)分詞的權(quán)重。
8.如權(quán)利要求5~7中任一項(xiàng)所述的裝置,其特征在于,如果所述最相似問題的答案與所述候選答案集合中各個(gè)答案的相似度均小于預(yù)設(shè)相似度閾值,所述答案生成模塊則配置為對(duì)所述候選答案集合進(jìn)行聚類迭代,確定所述候選答案集合中與所述對(duì)話交互數(shù)據(jù)最相關(guān)的答案并輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京光年無限科技有限公司,未經(jīng)北京光年無限科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710017117.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:火焰防護(hù)罩
- 下一篇:一種用于運(yùn)輸變壓器線圈的裝置
- 對(duì)話控制裝置、對(duì)話控制方法以及記錄介質(zhì)
- 任務(wù)對(duì)話系統(tǒng)中的對(duì)話處理方法及裝置
- 一種人機(jī)對(duì)話的方法、裝置和存儲(chǔ)介質(zhì)
- 對(duì)話(中)獎(jiǎng)勵(lì)評(píng)估和對(duì)話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對(duì)話方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種輔助英文對(duì)話的方法及系統(tǒng)
- 一種回復(fù)對(duì)話評(píng)分模型訓(xùn)練方法、對(duì)話回復(fù)方法及其裝置
- 一種多輪對(duì)話的問題定位方法及裝置
- 文本對(duì)話方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話型文本分類方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





