[發(fā)明專利]一種基于情感分類的多層歸因圖譜構(gòu)建方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110621640.4 | 申請(qǐng)日: | 2021-06-03 |
| 公開(公告)號(hào): | CN113495960A | 公開(公告)日: | 2021-10-12 |
| 發(fā)明(設(shè)計(jì))人: | 錢虹;江元元 | 申請(qǐng)(專利權(quán))人: | 創(chuàng)絡(luò)(上海)數(shù)據(jù)科技有限公司 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F16/36;G06F40/289;G06F40/30;G06Q30/02;G06Q30/06;G06N3/04 |
| 代理公司: | 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 31253 | 代理人: | 輦甲武 |
| 地址: | 201100 上海市閔*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 情感 分類 多層 歸因 圖譜 構(gòu)建 方法 | ||
1.一種基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于,包括如下步驟:
步驟一、數(shù)據(jù)處理:對(duì)打好標(biāo)簽的輔助領(lǐng)域和源領(lǐng)域的樣本,使用分詞工具進(jìn)行分詞、對(duì)標(biāo)點(diǎn)和停用詞處理,并且將分詞后的文本映射成向量;
步驟二、利用步驟一中處理后得到的樣本,進(jìn)行LSTM網(wǎng)絡(luò)搭建,并訓(xùn)練得到如下兩個(gè)模型:
a)情感傾向的極性分類預(yù)測(cè)模型,
b)負(fù)向內(nèi)容傾向的方面級(jí)相關(guān)分類預(yù)測(cè)模型,
步驟三、方面特征框架的形成:
利用上述訓(xùn)練好的模型a)和模型b)對(duì)新數(shù)據(jù)進(jìn)行標(biāo)簽預(yù)測(cè)打標(biāo),
根據(jù)模型a)生成情感傾向的極性分類標(biāo)簽,
根據(jù)模型b)生成負(fù)向內(nèi)容傾向的方面級(jí)相關(guān)分類標(biāo)簽,形成方面級(jí)大類框架;
步驟四、
將模型a)和模型b)訓(xùn)練建模后,對(duì)預(yù)測(cè)樣本進(jìn)行預(yù)測(cè)形成兩種不同分類的預(yù)測(cè)結(jié)果標(biāo)簽,并對(duì)結(jié)果標(biāo)簽進(jìn)行交叉,形成更細(xì)化的分類,最后提取其中的負(fù)向內(nèi)容,結(jié)合上述模型的LSTM預(yù)測(cè)標(biāo)簽,形成方面級(jí)特征框架雛形;
步驟五、對(duì)于方面級(jí)特征框架雛形中每個(gè)細(xì)分群進(jìn)行進(jìn)一步關(guān)注級(jí)細(xì)化分群,方式如下:
再次通過框架內(nèi)聚類分群對(duì)關(guān)鍵詞進(jìn)行不同粒度的多層細(xì)分,形成可供專家自由選擇的分合彈性歸納空間,然后結(jié)合業(yè)務(wù)歸納及可辨識(shí)度,進(jìn)一步根據(jù)交互觀測(cè)圖譜確定合適的細(xì)分粒度,通過這種交互歸納提煉出可理解、可操作的多項(xiàng)關(guān)注級(jí)細(xì)化關(guān)注點(diǎn),并提取其中的特征關(guān)鍵詞,補(bǔ)充到層級(jí)特征關(guān)鍵詞映射表中;
清晰化聚焦分群:在不影響清晰化也不影響操作針對(duì)性,且可控的前提下,對(duì)于每個(gè)關(guān)注級(jí)細(xì)化分群覆蓋到盡可能多的評(píng)論樣本,對(duì)于需要引入的類群,提取其中對(duì)應(yīng)層級(jí)特征關(guān)鍵詞增入到層級(jí)特征關(guān)鍵詞映射表中;
對(duì)方面級(jí)特征框架雛形中的每個(gè)細(xì)分群均作上述處理,逐步形成基于評(píng)論內(nèi)容的多層歸因圖譜。
2.如權(quán)利要求1所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
在步驟四和步驟五之間還包括步驟六,應(yīng)用延展步驟:
步驟6-1,使用業(yè)務(wù)層級(jí)關(guān)鍵詞映射表接收業(yè)務(wù)層設(shè)置的關(guān)鍵詞。
3.如權(quán)利要求2所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
步驟六中還包括:步驟6-2,融合業(yè)務(wù)人員細(xì)分,并輔以模型細(xì)分觀測(cè),進(jìn)一步補(bǔ)充與完善步驟6-1中的業(yè)務(wù)層級(jí)關(guān)鍵詞映射表。
4.如權(quán)利要求1所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
步驟五中,在步驟四搭建形成的方面級(jí)特征框架雛形范圍內(nèi),針對(duì)其中的每個(gè)細(xì)分評(píng)論群,根據(jù)業(yè)務(wù)視角分群的交互圖譜和經(jīng)無監(jiān)督模型分類后的類群對(duì)應(yīng)的交互圖譜之間的清晰度和區(qū)分程度穿插構(gòu)建聚焦分群。
5.如權(quán)利要求1所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
步驟五中,還包括構(gòu)建清晰化聚焦分群的步驟:在步驟四搭建形成的方面級(jí)特征框架雛形范圍內(nèi),針對(duì)其中的每個(gè)細(xì)分評(píng)論群,使用經(jīng)業(yè)務(wù)視角分群的交互圖譜和經(jīng)無監(jiān)督模型分類后的類群對(duì)應(yīng)的交互圖譜之間的清晰度和區(qū)分程度來穿插構(gòu)建清晰化聚焦分群。
6.如權(quán)利要求1所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
步驟五中,還包括形成補(bǔ)充細(xì)分群的步驟:形成補(bǔ)充細(xì)分群:若在無監(jiān)督分類模型中有出現(xiàn),但前期業(yè)務(wù)關(guān)鍵詞梳理中未包含的細(xì)分群,根據(jù)觀測(cè)到的圖譜內(nèi)容,補(bǔ)充層級(jí)特征關(guān)鍵詞到映射表中。
7.如權(quán)利要求1所述的基于情感分類的多層歸因圖譜構(gòu)建方法,其特征在于:
步驟二中,情感傾向的極性分類預(yù)測(cè)模型,第一層采用bi-LSTM最后的1個(gè)輸出單元經(jīng)sigmoid函數(shù)計(jì)算,得到最終的分類值;
負(fù)向內(nèi)容傾向的方面級(jí)相關(guān)分類預(yù)測(cè)模型采用標(biāo)準(zhǔn)的LSTM神經(jīng)網(wǎng)絡(luò),之后形成多個(gè)輸出單元由softmax層計(jì)算得出對(duì)應(yīng)的分類值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于創(chuàng)絡(luò)(上海)數(shù)據(jù)科技有限公司,未經(jīng)創(chuàng)絡(luò)(上海)數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110621640.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





