[發(fā)明專利]一種基于決策樹的任務(wù)導(dǎo)向型自動(dòng)對(duì)話方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910795839.1 | 申請(qǐng)日: | 2019-08-27 |
| 公開(公告)號(hào): | CN110532363B | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 王成;胡艷霞 | 申請(qǐng)(專利權(quán))人: | 華僑大學(xué) |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/35;G06F40/216;G06F40/289;G06K9/62 |
| 代理公司: | 廈門市首創(chuàng)君合專利事務(wù)所有限公司 35204 | 代理人: | 張松亭;李艾華 |
| 地址: | 362000 福建省*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 決策樹 任務(wù) 導(dǎo)向 自動(dòng) 對(duì)話 方法 | ||
1.一種基于決策樹的任務(wù)導(dǎo)向型自動(dòng)對(duì)話方法,其特征在于,包括:
1.1)將法律咨詢的結(jié)論離散化為分類類別,把與結(jié)論相關(guān)的當(dāng)事人的信息離散化為基本屬性;
1.2)接收當(dāng)事人咨詢的問題,通過分類算法抽取基本屬性對(duì)應(yīng)的屬性值,結(jié)論對(duì)應(yīng)的類別值;
1.3)將收集的實(shí)際案例作為訓(xùn)練樣本,建立基于決策樹的法律咨詢分類預(yù)測模型;
1.4)接收新的當(dāng)事人的咨詢,根據(jù)所建立的決策樹實(shí)現(xiàn)咨詢對(duì)話的過程,并返回當(dāng)事人咨詢的結(jié)論;
所述1.2),具體包括:
1.2.1)通過標(biāo)簽工程對(duì)部分咨詢案例中句子的每個(gè)屬性所對(duì)應(yīng)的屬性值打標(biāo)簽;
1.2.2)通過標(biāo)簽工程對(duì)部分咨詢案例中的結(jié)論所對(duì)應(yīng)的分類類別打標(biāo)簽;
1.2.3)對(duì)標(biāo)簽數(shù)據(jù)集通過分類算法訓(xùn)練模型;
1.2.4)通過分類算法訓(xùn)練的模型對(duì)咨詢案例進(jìn)行屬性值提取,及對(duì)結(jié)論對(duì)應(yīng)的類別值提取;
所述1.2.3),具體包括:
1.2.3.1)標(biāo)簽數(shù)據(jù)集設(shè)定為一個(gè)句子,該句子對(duì)應(yīng)的屬性值類別標(biāo)簽為y;
1.2.3.2)文本特征提取:首先通過分詞工具對(duì)所述句子分詞,去掉分詞結(jié)果中的停用詞和低頻詞,其次每個(gè)詞語在該數(shù)據(jù)集中對(duì)應(yīng)的權(quán)重,計(jì)算公式如下:
TF-IDF=TFl*IDFl
1.2.3.3)將得到的權(quán)重?cái)?shù)據(jù)作為LDA文本主題模型的輸入,訓(xùn)練提取句子主題特征x;
1.2.3.4)將提取的特征x作為分類算法的輸入,通過SVM算法進(jìn)行模型的訓(xùn)練,具體計(jì)算如下:
首先假設(shè)在高維空間的某一分類界面是y=wx+b;其中w表示界面的權(quán)重,b表示界面的偏差,w和b的初值通過隨機(jī)初始化獲得,某一特征點(diǎn)xi到平面的距離表達(dá)式為:
找到最近點(diǎn)距離最遠(yuǎn)的分界面,讓?duì)?Sub>i的值最大,也就是目標(biāo)函數(shù),即:
其中,s表示句子總數(shù),分析目標(biāo)函數(shù),并將原分類問題可以轉(zhuǎn)化為:
s.t.yi(wxi+b)≥1,i=1,2,3,...s
引入拉格朗日乘子αi可得到拉格朗日函數(shù),拉格朗日乘子αi將約束條件函數(shù)與原函數(shù)聯(lián)系到一起,使能配成與變量數(shù)量相等的等式方程,從而求出得到原函數(shù)極值的各個(gè)變量的解:
s.t.αi≥0
將問題轉(zhuǎn)換為求極大極小問題,即通過進(jìn)一步轉(zhuǎn)化分析得到其等價(jià)形式為:
假設(shè)至少有一個(gè)αj0,得到
其中,b*為目標(biāo)函數(shù)的最優(yōu)解,α*為對(duì)偶問題的最優(yōu)解,由此得到目標(biāo)函數(shù)分類的超平面,以將不同類別的數(shù)據(jù)劃分;
所述1.2.4),具體包括:
提取所有咨詢案例的主題特征,輸入訓(xùn)練好的分類算法模型中,預(yù)測其屬性對(duì)應(yīng)的屬性值類別,從而得到所有案例咨詢的結(jié)構(gòu)化數(shù)據(jù);
所述1.3),具體包括:
1.3.1)將得到的所有咨詢案例的結(jié)構(gòu)化數(shù)據(jù)作為決策樹的輸入;
1.3.2)分類屬性的選擇即選擇最優(yōu)劃分屬性,采取信息增益率的方法從屬性集合A={a1,a2,…,an}中選取最優(yōu)的屬性aj;
所述1.3.2),具體包括:
1.3.2.1)首先對(duì)結(jié)論D進(jìn)行信息熵的計(jì)算,計(jì)算公式如下:
其中,m代表D的類別數(shù)目,Pi代表結(jié)論D對(duì)應(yīng)類別i的總數(shù)占總的案例咨詢個(gè)數(shù);
1.3.2.2)其次對(duì)所有屬性進(jìn)行信息熵的計(jì)算,計(jì)算公式如下:
其中,Qi代表在屬性aj對(duì)應(yīng)的屬性值類別k的條件下結(jié)論D中對(duì)應(yīng)類別i的總數(shù)占屬性aj對(duì)應(yīng)的屬性值類別k的總數(shù),表示屬性aj對(duì)應(yīng)的屬性值類別k的數(shù)據(jù)信息;k∈[1,v],v表示aj對(duì)應(yīng)屬性值類別的總數(shù);
1.3.2.3)計(jì)算在選擇屬性aj的情況下的信息熵,也叫條件熵,具體計(jì)算如下:
其中,|D|代表總的案例咨詢個(gè)數(shù),代表屬性值類別為k的數(shù)目;
1.3.2.4)信息增益定義為原來的信息需求與新需求之間的差,如下:
Gain(aj)=Info(D)-Info(D|aj)
1.3.2.5)計(jì)算屬性aj的分裂信息,具體計(jì)算如下:
1.3.2.6)信息增益率使用分裂信息值將信息增益規(guī)范化,具體計(jì)算如下:
1.3.2.7)計(jì)算所有屬性A的信息增益率,然后選取信息增益率最大的屬性作為分裂節(jié)點(diǎn),即a=max(GainRatio(a1),GainRatio(a2),…,GainRatio(an)),屬性節(jié)點(diǎn)a的每個(gè)屬性值對(duì)應(yīng)一個(gè)分支,且分支的數(shù)據(jù)為在屬性值為k的情況下剩余屬性及結(jié)論的數(shù)據(jù),當(dāng)分支對(duì)應(yīng)的還有剩余屬性可選擇并且結(jié)論數(shù)據(jù)中的類別不唯一時(shí),重復(fù)步驟1.3.2.1-1.3.2.7,否則停止分裂;
所述1.4),具體包括:
1.4.1)當(dāng)接收到新的當(dāng)事人咨詢信息時(shí),從決策樹根節(jié)點(diǎn)開始,向用戶提出屬性節(jié)點(diǎn)對(duì)應(yīng)的問題,抽取當(dāng)事人的信息;
1.4.2)將得到的主題特征輸入訓(xùn)練好的分類算法模型中,預(yù)測其屬性對(duì)應(yīng)的屬性值類別;
1.4.3)根據(jù)預(yù)測的屬性值類別與決策樹當(dāng)前節(jié)點(diǎn)屬性的屬性值進(jìn)行比較,選擇相等時(shí)的分支作為下一步對(duì)話的子決策樹;
1.4.4)當(dāng)子決策樹為葉子結(jié)點(diǎn)是停止對(duì)話,并且返回最后的結(jié)論類別對(duì)應(yīng)的答案返回給當(dāng)事人,否則重復(fù)1.4.1-1.4.3步驟。
2.根據(jù)權(quán)利要求1所述的基于決策樹的任務(wù)導(dǎo)向型自動(dòng)對(duì)話方法,其特征在于,所述1.1),具體包括:
1.1.1)分析給出結(jié)論的類別個(gè)數(shù),明確每個(gè)類別對(duì)應(yīng)的類別含義;
1.1.2)分析并提供可能影響結(jié)論的屬性集合以及屬性對(duì)應(yīng)的屬性值類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華僑大學(xué),未經(jīng)華僑大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910795839.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)





