[發(fā)明專利]跨領(lǐng)域文本情感分類模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 201810922343.1 | 申請日: | 2018-08-14 |
| 公開(公告)號: | CN109308318B | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 傅向華;劉旺旺 | 申請(專利權(quán))人: | 深圳大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 深圳青年人專利商標(biāo)代理有限公司 44350 | 代理人: | 吳桂華 |
| 地址: | 518060 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 領(lǐng)域 文本 情感 分類 模型 訓(xùn)練 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種跨領(lǐng)域文本情感分類模型的訓(xùn)練方法,其特征在于,所述方法包括下述步驟:
根據(jù)預(yù)設(shè)的源領(lǐng)域樣本集和預(yù)設(shè)的目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練,所述目標(biāo)領(lǐng)域樣本集中的每個(gè)目標(biāo)樣本為無標(biāo)簽樣本,所述跨領(lǐng)域文本情感分類模型由自動編碼器、領(lǐng)域分類器以及情感分類器組成;
根據(jù)訓(xùn)練好的所述跨領(lǐng)域文本情感分類模型對所述目標(biāo)領(lǐng)域樣本集進(jìn)行情感分類,得到所述每個(gè)目標(biāo)樣本對應(yīng)的情感預(yù)測標(biāo)簽和所述每個(gè)目標(biāo)樣本屬于預(yù)設(shè)的每個(gè)情感類別的隸屬度;
根據(jù)所述隸屬度,通過預(yù)設(shè)的模糊值公式計(jì)算所述每個(gè)目標(biāo)樣本的情感模糊值,得到對應(yīng)的情感模糊值集;
將所述情感模糊值集中低于預(yù)設(shè)模糊閾值的情感模糊值對應(yīng)的目標(biāo)樣本和所述目標(biāo)樣本對應(yīng)的情感預(yù)測標(biāo)簽添加到所述源領(lǐng)域樣本集中,以對所述源領(lǐng)域樣本集進(jìn)行擴(kuò)充;
根據(jù)擴(kuò)充后的所述源領(lǐng)域樣本集和所述目標(biāo)領(lǐng)域樣本集對所述跨領(lǐng)域文本情感分類模型進(jìn)行再次訓(xùn)練,以完成對所述跨領(lǐng)域文本情感分類模型的訓(xùn)練;
根據(jù)預(yù)設(shè)的源領(lǐng)域樣本集和預(yù)設(shè)的目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練的步驟,包括:
根據(jù)預(yù)設(shè)的模型代價(jià)損失函數(shù)、所述源領(lǐng)域樣本集以及所述目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練,所述模型代價(jià)損失函數(shù)lALL為lALL=lSC+αlAE+βlDC,其中,lSC為預(yù)設(shè)的所述情感分類器的代價(jià)損失函數(shù),lAE為預(yù)設(shè)的所述自動編碼器的代價(jià)損失函數(shù),α為預(yù)設(shè)的所述自動編碼器的損失權(quán)衡參數(shù),lDC為預(yù)設(shè)的所述領(lǐng)域分類器的代價(jià)損失函數(shù),β為預(yù)設(shè)的所述領(lǐng)域分類器的損失權(quán)衡參數(shù)。
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)預(yù)設(shè)的模型代價(jià)損失函數(shù)、所述源領(lǐng)域樣本集以及所述目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練的步驟,包括:
根據(jù)所述自動編碼器的代價(jià)損失函數(shù)和所述源領(lǐng)域樣本集對所述自動編碼器進(jìn)行訓(xùn)練,根據(jù)所述領(lǐng)域分類器的代價(jià)損失函數(shù)、所述源領(lǐng)域樣本集以及所述目標(biāo)領(lǐng)域樣本集對所述領(lǐng)域分類器進(jìn)行訓(xùn)練,根據(jù)所述情感分類器的代價(jià)損失函數(shù)和所述源領(lǐng)域樣本集對所述情感分類器進(jìn)行訓(xùn)練。
3.一種跨領(lǐng)域文本情感分類模型的訓(xùn)練裝置,其特征在于,所述裝置包括:
模型初次訓(xùn)練單元,用于根據(jù)預(yù)設(shè)的源領(lǐng)域樣本集和預(yù)設(shè)的目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練,所述目標(biāo)領(lǐng)域樣本集中的每個(gè)目標(biāo)樣本為無標(biāo)簽樣本,所述跨領(lǐng)域文本情感分類模型由自動編碼器、領(lǐng)域分類器以及情感分類器組成;
情感分類單元,用于根據(jù)訓(xùn)練好的所述跨領(lǐng)域文本情感分類模型對所述目標(biāo)領(lǐng)域樣本集進(jìn)行情感分類,得到所述每個(gè)目標(biāo)樣本對應(yīng)的情感預(yù)測標(biāo)簽和所述每個(gè)目標(biāo)樣本屬于預(yù)設(shè)的每個(gè)情感類別的隸屬度;
模糊值計(jì)算單元,用于根據(jù)所述隸屬度,通過預(yù)設(shè)的模糊值公式計(jì)算所述每個(gè)目標(biāo)樣本的情感模糊值,得到對應(yīng)的情感模糊值集;
源樣本集擴(kuò)充單元,用于將所述情感模糊值集中低于預(yù)設(shè)模糊閾值的情感模糊值對應(yīng)的目標(biāo)樣本和所述目標(biāo)樣本對應(yīng)的情感預(yù)測標(biāo)簽添加到所述源領(lǐng)域樣本集中,以對所述源領(lǐng)域樣本集進(jìn)行擴(kuò)充;以及
模型再次訓(xùn)練單元,用于根據(jù)擴(kuò)充后的所述源領(lǐng)域樣本集和所述目標(biāo)領(lǐng)域樣本集對所述跨領(lǐng)域文本情感分類模型進(jìn)行再次訓(xùn)練,以完成對所述跨領(lǐng)域文本情感分類模型的訓(xùn)練;
所述模型初次訓(xùn)練單元包括:
模型訓(xùn)練子單元,用于根據(jù)預(yù)設(shè)的模型代價(jià)損失函數(shù)、所述源領(lǐng)域樣本集以及所述目標(biāo)領(lǐng)域樣本集對預(yù)先構(gòu)建的跨領(lǐng)域文本情感分類模型進(jìn)行初次訓(xùn)練,所述模型代價(jià)損失函數(shù)lALL為lALL=lSC+αlAE+βlDC,其中,lSC為預(yù)設(shè)的所述情感分類器的代價(jià)損失函數(shù),lAE為預(yù)設(shè)的所述自動編碼器的代價(jià)損失函數(shù),α為預(yù)設(shè)的所述自動編碼器的損失權(quán)衡參數(shù),lDC為預(yù)設(shè)的所述領(lǐng)域分類器的代價(jià)損失函數(shù),β為預(yù)設(shè)的所述領(lǐng)域分類器的損失權(quán)衡參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳大學(xué),未經(jīng)深圳大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810922343.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





