[發(fā)明專利]增量意圖聚類方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011531561.6 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112527969B | 公開(公告)日: | 2022-11-15 |
| 發(fā)明(設(shè)計)人: | 黃健;李鋒;楊洋;汪赟;潘仰耀;張琛;萬化 | 申請(專利權(quán))人: | 上海浦東發(fā)展銀行股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/289 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 劉飛;賈磊 |
| 地址: | 200002 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 增量 意圖 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種增量意圖聚類方法,其特征在于,包括:
獲取增量對話語料;
從所述增量對話語料中提取文本關(guān)鍵詞;
將所述文本關(guān)鍵詞轉(zhuǎn)換為第一詞向量,以作為所述增量對話語料的向量化表示;
確定所述第一詞向量與歷史意圖類別集合中各第二詞向量的相似度;所述各第二詞向量為對應(yīng)歷史意圖類別的文本關(guān)鍵詞的向量表示;
根據(jù)所述相似度對所述文本關(guān)鍵詞進(jìn)行意圖聚類;
其中,所述歷史意圖類別集合通過以下方式獲得:
從歷史對話語料中提取業(yè)務(wù)操作動詞集合和業(yè)務(wù)名詞集合;
根據(jù)所述業(yè)務(wù)操作動詞集合和所述業(yè)務(wù)名詞集合構(gòu)建領(lǐng)域詞典;
根據(jù)所述領(lǐng)域詞典對所述歷史對話語料進(jìn)行分詞,獲得分詞結(jié)果;
用所述分詞結(jié)果訓(xùn)練詞向量模型,獲得所述歷史對話語料的領(lǐng)域詞向量集合;
獲取所述歷史對話語料中各次對話語料的文本關(guān)鍵詞;
根據(jù)所述領(lǐng)域詞向量集合將所述各次對話語料的文本關(guān)鍵詞進(jìn)行向量化,獲得向量化對話語料集合;
對所述向量化對話語料集合中的向量化對話語料進(jìn)行意圖聚類,獲得歷史意圖類別集合;
所述對所述向量化對話語料集合中的向量化對話語料進(jìn)行意圖聚類,包括:
當(dāng)兩個向量化對話語料的業(yè)務(wù)操作動詞向量的相似度達(dá)到第一閾值,且所述兩個向量化對話語料的業(yè)務(wù)名詞向量的相似度達(dá)到第二閾值時,將所述兩個向量化對話語料聚類為同一個意圖類別;
確定同一個意圖類別中,各個向量化對話語料的業(yè)務(wù)操作動詞向量的第一均值,及各個向量化對話語料對應(yīng)的第二均值;
將所述第一均值和所述第二均值按序拼接組合,以作為該意圖類別的向量表示。
2.如權(quán)利要求1所述的增量意圖聚類方法,其特征在于,所述將所述文本關(guān)鍵詞轉(zhuǎn)換為第一詞向量,包括:
確認(rèn)所述文本關(guān)鍵詞中是否包含業(yè)務(wù)操作動詞和業(yè)務(wù)名詞;
當(dāng)所述文本關(guān)鍵詞中包含一個業(yè)務(wù)操作動詞以及一個業(yè)務(wù)名詞時,將該業(yè)務(wù)操作動詞及該業(yè)務(wù)名詞所對應(yīng)的詞向量按序拼接為第一詞向量。
3.如權(quán)利要求2所述的增量意圖聚類方法,其特征在于,所述將所述文本關(guān)鍵詞轉(zhuǎn)換為第一詞向量,還包括:
當(dāng)所述文本關(guān)鍵詞中包含一個業(yè)務(wù)操作動詞以及多個業(yè)務(wù)名詞時,獲取所述多個業(yè)務(wù)名詞對應(yīng)的詞向量;
確定所述多個業(yè)務(wù)名詞對應(yīng)詞向量的均值;
將該業(yè)務(wù)操作動詞對應(yīng)的詞向量及所述均值按序拼接為第一詞向量。
4.如權(quán)利要求2所述的增量意圖聚類方法,其特征在于,所述將所述文本關(guān)鍵詞轉(zhuǎn)換為第一詞向量,還包括:
當(dāng)所述文本關(guān)鍵詞中包含一個業(yè)務(wù)操作動詞,且不包含業(yè)務(wù)名詞時,獲取所述文本關(guān)鍵詞中所有名詞性詞語對應(yīng)的詞向量;
確定所述所有名詞性詞語對應(yīng)的詞向量的均值;將該業(yè)務(wù)操作動詞對應(yīng)的詞向量及所述均值按序拼接為第一詞向量。
5.如權(quán)利要求1所述的增量意圖聚類方法,其特征在于,所述根據(jù)所述相似度對所述文本關(guān)鍵詞進(jìn)行意圖聚類,包括:
當(dāng)所述第一詞向量與所述各第二詞向量的相似度均小于設(shè)定閾值時,則確認(rèn)所述第一詞向量對應(yīng)的增量對話語料為增量意圖類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海浦東發(fā)展銀行股份有限公司,未經(jīng)上海浦東發(fā)展銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011531561.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計裝置以及意圖估計方法
- 意圖識別方法、裝置、設(shè)備及計算機(jī)可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





