在審
| 申請?zhí)枺?/td> | 202010173479.4 | 申請日: | 2020-03-13 |
| 公開(公告)號(hào): | CN111046979A | 公開(公告)日: | 2020-04-21 |
| 發(fā)明(設(shè)計(jì))人: | 郭濤;江嶺 | 申請(專利權(quán))人: | 成都曉多科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 成都睿道專利代理事務(wù)所(普通合伙) 51217 | 代理人: | 李紅 |
| 地址: | 610000 四川省成都市天府新區(qū)華*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 樣本 學(xué)習(xí) badcase 發(fā)現(xiàn) 方法 系統(tǒng) | ||
1.一種基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:包括如下步驟:
S1:數(shù)據(jù)預(yù)處理,從已標(biāo)注訓(xùn)練語料中隨機(jī)獲取多個(gè)小樣本,并將樣本分為支持集和目標(biāo)集;
S2:模型預(yù)訓(xùn)練,將樣本輸入基礎(chǔ)模型與兩種注意力機(jī)制的結(jié)合,訓(xùn)練得到badcase發(fā)現(xiàn)模型;
S3:預(yù)測數(shù)據(jù)組裝,根據(jù)線上預(yù)測結(jié)果語義,從已標(biāo)注訓(xùn)練語料中獲取線上預(yù)測結(jié)果語義下的小樣本,并與待預(yù)測句子組成預(yù)測數(shù)據(jù);
S4:數(shù)據(jù)預(yù)測,將預(yù)測數(shù)據(jù)輸入badcase發(fā)現(xiàn)模型,預(yù)測得到待預(yù)測句子的預(yù)測語義,對(duì)比預(yù)測語義和線上預(yù)測結(jié)果語義,判斷待預(yù)測句子是否為badcase。
2.根據(jù)權(quán)利要求1所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的小樣本采用N-way K-shot的數(shù)據(jù)形式,N表示每個(gè)小訓(xùn)練批次包括的語義個(gè)數(shù),K表示每個(gè)語義下的訓(xùn)練樣本個(gè)數(shù)。
3.根據(jù)權(quán)利要求1所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的基礎(chǔ)模型為原型網(wǎng)絡(luò)Prototypical Networks或Siamese Network,所述的兩種注意力機(jī)制為實(shí)例級(jí)注意力機(jī)制和特征級(jí)注意力機(jī)制。
4.根據(jù)權(quán)利要求3所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的模型預(yù)訓(xùn)練具體包括:
S201:將支持集和目標(biāo)集分別輸入基礎(chǔ)網(wǎng)絡(luò);
S202:支持集和目標(biāo)集的樣本各自經(jīng)過encoder模塊的編碼,得到統(tǒng)一維度的向量,目標(biāo)集產(chǎn)出向量為X;
S203:支持集內(nèi)各個(gè)樣本的向量分別計(jì)算特征級(jí)注意力F并經(jīng)過權(quán)重求和得到輸出每個(gè)支持集的向量Zi;
S204:支持集內(nèi)各個(gè)樣本的向量分別與目標(biāo)集的向量X一起計(jì)算實(shí)例級(jí)注意力I并經(jīng)過權(quán)重求和得到每個(gè)支持集的輸出向量Ci;
S205:進(jìn)行距離度量計(jì)算,得到和目標(biāo)集向量X最接近的支持集;
S206:根據(jù)最接近的支持集與目標(biāo)集的真實(shí)標(biāo)簽進(jìn)行損失函數(shù)計(jì)算,更新模型參數(shù);
S207:迭代循環(huán),直到損失函數(shù)值趨于穩(wěn)定,得到badcase發(fā)現(xiàn)模型。
5.根據(jù)權(quán)利要求4所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的距離度量計(jì)算采用距離度量公式di=Zi*[Ci-x]2進(jìn)行計(jì)算。
6.根據(jù)權(quán)利要求1所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的預(yù)測數(shù)據(jù)包括支持集和目標(biāo)集,支持集為從已標(biāo)注訓(xùn)練語料中獲取的線上預(yù)測結(jié)果語義下的小樣本,目標(biāo)集為待預(yù)測句子。
7.根據(jù)權(quán)利要求6所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的預(yù)測數(shù)據(jù)的支持集來自三個(gè)方向,分別為以詞為單位,與分詞后的預(yù)測句子重合頻次最多的樣本、主動(dòng)學(xué)習(xí)樣本或隨機(jī)樣本。
8.根據(jù)權(quán)利要求1所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法,其特征在于:所述的判斷待預(yù)測句子是否為badcase的依據(jù)為:當(dāng)預(yù)測語義和線上預(yù)測結(jié)果語義不一致時(shí),則待預(yù)測句子為badcase。
9.基于權(quán)利要求1-8中任意一項(xiàng)所述的基于小樣本學(xué)習(xí)的badcase發(fā)現(xiàn)方法的系統(tǒng),其特征在于:包括訓(xùn)練數(shù)據(jù)處理單元、模型訓(xùn)練單元、待預(yù)測數(shù)據(jù)組裝單元和數(shù)據(jù)預(yù)測單元,所述的訓(xùn)練數(shù)據(jù)處理單元從已標(biāo)注訓(xùn)練預(yù)料中隨機(jī)獲取多個(gè)小樣本,并將樣本分為支持集和目標(biāo)集;所述的模型訓(xùn)練單元將樣本輸入基礎(chǔ)模型與兩種注意力機(jī)制的結(jié)合,訓(xùn)練得到badcase發(fā)現(xiàn)模型;所述的待預(yù)測數(shù)據(jù)組裝單元根據(jù)線上預(yù)測結(jié)果語義,從已標(biāo)注訓(xùn)練語料中獲取線上預(yù)測結(jié)果語義下的小樣本,并與待預(yù)測句子組成預(yù)測數(shù)據(jù);所述的數(shù)據(jù)預(yù)測單元將預(yù)測數(shù)據(jù)輸入badcase發(fā)現(xiàn)模型,預(yù)測得到待預(yù)測句子的預(yù)測語義,對(duì)比預(yù)測語義和線上預(yù)測結(jié)果語義,判斷待預(yù)測句子是否為badcase。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都曉多科技有限公司,未經(jīng)成都曉多科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010173479.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測系統(tǒng)
- 樣本分析裝置、樣本檢測設(shè)備及樣本檢測方法
- 樣本檢測方法、樣本檢測裝置及樣本檢測系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)





