[發(fā)明專利]意圖分類模型的訓(xùn)練方法、分類方法、系統(tǒng)、設(shè)備和介質(zhì)有效
| 申請?zhí)枺?/td> | 201811333427.8 | 申請日: | 2018-11-09 |
| 公開(公告)號: | CN109492104B | 公開(公告)日: | 2023-01-31 |
| 發(fā)明(設(shè)計)人: | 楊俊 | 申請(專利權(quán))人: | 北京匯鈞科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36 |
| 代理公司: | 上海弼興律師事務(wù)所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)濟*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 意圖 分類 模型 訓(xùn)練 方法 系統(tǒng) 設(shè)備 介質(zhì) | ||
1.一種意圖分類模型的訓(xùn)練方法,其特征在于,所述訓(xùn)練方法包括:
獲取多組原始數(shù)據(jù),每組原始數(shù)據(jù)包括用戶的輸入內(nèi)容以及所述用戶的行為數(shù)據(jù);
標(biāo)注每組原始數(shù)據(jù)中輸入內(nèi)容的意圖類別;
根據(jù)所述多組原始數(shù)據(jù)以及所述多組原始數(shù)據(jù)中輸入內(nèi)容的意圖類別構(gòu)造多組訓(xùn)練數(shù)據(jù);
根據(jù)所述多組訓(xùn)練數(shù)據(jù)訓(xùn)練所述意圖分類模型,所述意圖分類模型用于根據(jù)原始數(shù)據(jù)生成所述原始數(shù)據(jù)中輸入內(nèi)容的意圖類別;
所述行為數(shù)據(jù)包括實時行為數(shù)據(jù)和歷史行為數(shù)據(jù);
所述實時行為數(shù)據(jù)包括用戶在輸入內(nèi)容之前訪問過的URL;
所述歷史行為數(shù)據(jù)包括用戶個人信息、用戶訂單數(shù)據(jù)、用戶畫像中的至少一個;
所述構(gòu)造多組訓(xùn)練數(shù)據(jù)的步驟包括:
對于每組原始數(shù)據(jù),將行為數(shù)據(jù)輸入決策樹;
所述決策樹輸出所述行為數(shù)據(jù)的組合特征;
將所述組合特征轉(zhuǎn)換成組合特征向量;
利用所述組合特征向量構(gòu)造訓(xùn)練數(shù)據(jù);
其中,根據(jù)所述決策樹組合所述行為數(shù)據(jù),基于所述決策樹中根節(jié)點到所有葉節(jié)點之間經(jīng)過的節(jié)點構(gòu)成一個所述組合特征;
所述組合特征包括若干特征,所述若干特征對應(yīng)的信息增益均大于設(shè)定閾值且數(shù)量可自定義設(shè)置。
2.如權(quán)利要求1所述的意圖分類模型的訓(xùn)練方法,其特征在于,所述將所述組合特征轉(zhuǎn)換成組合特征向量的步驟包括:
利用one-hot轉(zhuǎn)換所述組合特征,得到組合特征向量。
3.如權(quán)利要求1所述的意圖分類模型的訓(xùn)練方法,其特征在于,構(gòu)造訓(xùn)練數(shù)據(jù)的步驟包括:
對于每組原始數(shù)據(jù),對輸入內(nèi)容進(jìn)行命名實體識別,得到若干實體;
將所述若干實體轉(zhuǎn)換成實體特征向量;
對行為數(shù)據(jù)進(jìn)行清洗,得到行為特征;
將所述行為特征轉(zhuǎn)換成行為特征向量;
利用所述實體特征向量和所述行為特征向量構(gòu)造訓(xùn)練數(shù)據(jù)。
4.如權(quán)利要求3所述的意圖分類模型的訓(xùn)練方法,其特征在于,所述將所述行為特征轉(zhuǎn)換成行為特征向量的步驟包括:
利用word2vec轉(zhuǎn)換經(jīng)清洗的實時行為數(shù)據(jù),得到行為特征向量;
利用one-hot轉(zhuǎn)換經(jīng)清洗的歷史行為數(shù)據(jù),得到行為特征向量;
和/或,所述將所述若干實體轉(zhuǎn)換成實體特征向量的步驟包括:
利用word2vec轉(zhuǎn)換所述若干實體,得到實體特征向量。
5.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1-4中任一項所述的意圖分類模型的訓(xùn)練方法。
6.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-4中任一項所述的意圖分類模型的訓(xùn)練方法的步驟。
7.一種意圖分類方法,其特征在于,所述意圖分類方法包括:
利用如權(quán)利要求1-4中任一項所述的意圖分類模型的訓(xùn)練方法訓(xùn)練意圖分類模型;
獲取用戶的輸入內(nèi)容;
對所述輸入內(nèi)容進(jìn)行命名實體識別,得到若干實體;
將所述若干實體轉(zhuǎn)換成實體特征向量;
獲取所述用戶的行為數(shù)據(jù);
對所述行為數(shù)據(jù)進(jìn)行清洗,得到行為特征;
將所述行為特征轉(zhuǎn)換成行為特征向量;
將所述實體特征向量和所述行為特征向量輸入所述意圖分類模型;
輸出所述輸入內(nèi)容的意圖類別。
8.如權(quán)利要求7所述的意圖分類方法,其特征在于,在所述獲取所述用戶的行為數(shù)據(jù)的步驟之后,所述意圖分類方法還包括:
將所述行為數(shù)據(jù)輸入決策樹;
所述決策樹輸出所述行為數(shù)據(jù)的組合特征;
將所述組合特征轉(zhuǎn)換成組合特征向量;
將所述組合特征向量同所述實體特征向量、所述行為特征向量一起輸入意圖分類模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京匯鈞科技有限公司,未經(jīng)北京匯鈞科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811333427.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計裝置以及意圖估計方法
- 意圖識別方法、裝置、設(shè)備及計算機可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





