日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種面向保險(xiǎn)文本的樣本采樣方法與裝置在審

專利信息
申請(qǐng)?zhí)枺?/td> 202210219956.5 申請(qǐng)日: 2022-03-08
公開(kāi)(公告)號(hào): CN114741504A 公開(kāi)(公告)日: 2022-07-12
發(fā)明(設(shè)計(jì))人: 丁鍇;那崇寧;陳奎 申請(qǐng)(專利權(quán))人: 之江實(shí)驗(yàn)室
主分類號(hào): G06F16/35 分類號(hào): G06F16/35;G06F40/30;G06F40/194;G06Q40/08
代理公司: 杭州求是專利事務(wù)所有限公司 33200 代理人: 邱啟旺
地址: 310023 浙江省杭州市余*** 國(guó)省代碼: 浙江;33
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 面向 保險(xiǎn) 文本 樣本 采樣 方法 裝置
【說(shuō)明書】:

本發(fā)明公開(kāi)了一種面向保險(xiǎn)文本的樣本采樣方法與裝置,該方法包括:基于語(yǔ)義的文本向量化和半監(jiān)督采樣兩部分。半監(jiān)督采樣又分為最遠(yuǎn)點(diǎn)采樣及標(biāo)注,基于分布的再采樣與再采樣樣本的標(biāo)注,模型分類精度驗(yàn)證等步驟。本發(fā)明方法基于語(yǔ)義向量化結(jié)合半監(jiān)督學(xué)習(xí)方法進(jìn)行樣本采樣,在極少標(biāo)注樣本的條件下,可以實(shí)現(xiàn)媲美全樣本標(biāo)注的模型精度和魯棒性,同時(shí)大幅減少模型訓(xùn)練的計(jì)算與時(shí)間成本。

技術(shù)領(lǐng)域

本發(fā)明屬于金融保險(xiǎn)文本識(shí)別領(lǐng)域,尤其涉及一種面向保險(xiǎn)文本的樣本采樣方法與裝置。

背景技術(shù)

隨著金融保險(xiǎn)行業(yè)信息化的發(fā)展,相關(guān)業(yè)務(wù)數(shù)據(jù)快速增長(zhǎng),人力的不足和精細(xì)化管理的需求使越來(lái)越多的深度學(xué)習(xí)模型被應(yīng)用,但相應(yīng)的數(shù)據(jù)標(biāo)注任務(wù)量也快速增加。如何標(biāo)注更少的樣本,達(dá)到更好的樣本多樣性和模型魯棒性,成為當(dāng)前金融保險(xiǎn)業(yè)模型研究的重要方向,它被稱為困難樣本挖掘問(wèn)題。困難樣本挖掘也是深度學(xué)習(xí)中的一項(xiàng)重要研究?jī)?nèi)容,相關(guān)研究分為兩個(gè)方向:其一是通過(guò)加權(quán)增大困難樣本的學(xué)習(xí)率,相關(guān)研究包括Focal loss,優(yōu)點(diǎn)是可以提高模型收斂速度,但缺點(diǎn)是標(biāo)注工作量未減少;其二是利用無(wú)監(jiān)督或者半監(jiān)督的方式對(duì)所有樣本進(jìn)行抽樣,找出易混淆的困難樣本,這種方法既可以減少標(biāo)注樣本的數(shù)量,又可以提高模型收斂速度,在實(shí)際工程應(yīng)用中更為有效。

文本樣本采樣通常包括兩個(gè)重要步驟,向量化和均勻采樣。向量化過(guò)程保證文本轉(zhuǎn)換為向量前后,相似性保持不變。均勻采樣保證采樣前后,樣本空間覆蓋范圍和空間結(jié)構(gòu)保持不變。文本向量化方式包括基于關(guān)鍵詞的向量化TF-IDF,BM25等,基于語(yǔ)義的向量化,如Topic-embedding,Sent-Bert。均勻采樣方法包括最遠(yuǎn)點(diǎn)采樣等。中國(guó)專利CN 112364130A公開(kāi)了一種文本采樣方法,使用字符編碼進(jìn)行文本向量化,并使用編輯距離計(jì)算文本距離,但是此方法不能很好表示文本之間的語(yǔ)義相似性。中國(guó)專利CN 112329427 A公開(kāi)了一種短信樣本的獲取方法,采用多重去重復(fù)的方式進(jìn)行短信采樣,使用短信模板結(jié)合短信來(lái)源時(shí)間等特征進(jìn)行相似度量化,并以分類不確定性指標(biāo)為最后一重篩選標(biāo)注樣本的方法,此方法對(duì)短信文本比較有效,但同樣未考慮樣本的語(yǔ)義相似性。

發(fā)明內(nèi)容

針對(duì)現(xiàn)有技術(shù)不足,本發(fā)明提出了一種面向保險(xiǎn)文本的樣本采樣方法與裝置。

為實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案為:

本發(fā)明實(shí)施例的第一方面提供了一種面向保險(xiǎn)文本的樣本采樣方法,包括以下步驟:

(1)構(gòu)建文本相似性判定預(yù)訓(xùn)練模型,通過(guò)該模型進(jìn)行文本向量化,得到總向量集;

(2)對(duì)總向量集進(jìn)行最遠(yuǎn)點(diǎn)初始采樣與標(biāo)注,實(shí)現(xiàn)采樣均勻分布于空間中,得到已選點(diǎn)集;

(3)設(shè)置樣本數(shù)量,對(duì)初始樣本集基于類間分布模型進(jìn)行再采樣,更新已選點(diǎn)集;

(4)設(shè)置采樣半徑比例和精度閾值,利用更新后的已選點(diǎn)集進(jìn)行模型訓(xùn)練與準(zhǔn)確度驗(yàn)證,直至符合準(zhǔn)確率,完成樣本采樣。

進(jìn)一步地,所述文本相似性判定預(yù)訓(xùn)練模型為Sent-Bert;所述Sent-Bert為一文本相似性度量模型,以預(yù)訓(xùn)練后的Bert為底層模型,在該底層模型增加一對(duì)基于池化的嵌入層,形成的共享底層參數(shù)的孿生網(wǎng)絡(luò)。

進(jìn)一步地,所述預(yù)訓(xùn)練具體為:通過(guò)人工標(biāo)注相似性的包括LCQMC,STS-B,ATEC在內(nèi)的中文數(shù)據(jù)庫(kù)對(duì)Sent Bert進(jìn)行精調(diào)訓(xùn)練。

進(jìn)一步地,將一對(duì)保險(xiǎn)文本輸入文本相似性判定預(yù)訓(xùn)練模型,輸出為兩個(gè)向量;第一向量為文本向量化后的結(jié)果,組成得到總向量集;第二向量為空。

進(jìn)一步地,所述步驟(2)具體包括以下子步驟:

(2.1)根據(jù)樣本的相似度與小樣本學(xué)習(xí)設(shè)置初始采樣集的樣本數(shù)量;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于之江實(shí)驗(yàn)室,未經(jīng)之江實(shí)驗(yàn)室許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210219956.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 中文字幕二区在线观看| 国产韩国精品一区二区三区| 国产一级片网站| 色乱码一区二区三在线看| 一区二区三区中文字幕| 欧美一区二三区人人喊爽| 国产精品视频二区三区| 国产无遮挡又黄又爽又色视频| 99re6国产露脸精品视频网站| 日韩久久精品一区二区| 理论片午午伦夜理片在线播放| 肉丝肉足丝袜一区二区三区| 国产激情二区| 国产女人和拘做受在线视频| 国产精欧美一区二区三区久久| 午夜无遮挡| 精品视频久| 欧美一区二区三区免费电影| 午夜一级电影| 欧美午夜理伦三级在线观看偷窥| 99re6国产露脸精品视频网站| 午夜看片网| 国产精品久久久久久久妇女| 免费的午夜毛片| xxxx18日本护士高清hd| 免费91麻豆精品国产自产在线观看| 国产在线拍揄自揄拍| 欧美777精品久久久久网| 蜜臀久久99静品久久久久久| 2023国产精品自产拍在线观看| 国产精品久久久久免费a∨大胸| 亚洲精品少妇久久久久| 性old老妇做受| 欧美在线视频三区| 狠狠色狠狠色综合日日2019| 精品香蕉一区二区三区| 精品国产亚洲一区二区三区| 国产精品免费不卡| 国产精品伦一区二区三区级视频频 | 午夜大片男女免费观看爽爽爽尤物| 少妇厨房与子伦免费观看| 日本午夜久久| 国产精品久久久麻豆| 热久久一区二区| 国产一区日韩精品| 亚洲国产日韩综合久久精品| 8x8x国产一区二区三区精品推荐| 欧美在线视频三区| 国产三级欧美三级日产三级99 | 国产一区二区三区的电影| 欧美一区二区三区久久精品视| 国产精品自产拍在线观看蜜| 91国内精品白嫩初高生| 欧美日韩国产一级| 国产69精品久久99不卡解锁版| 亚洲乱强伦| 国产日韩欧美精品一区二区 | 亚洲精华国产欧美| 97人人澡人人爽人人模亚洲 | 午夜毛片影院| 国产欧美一区二区三区沐欲| 日本一区午夜艳熟免费| 日本白嫩的18sex少妇hd| 国产麻豆一区二区三区在线观看 | 日韩午夜电影院| 国产91精品一区| 欧美亚洲视频一区| 国产精品一区二| 右手影院av| 国产无遮挡又黄又爽又色视频| 一区二区免费播放| 色婷婷综合久久久中文一区二区| 国产精品偷乱一区二区三区| 午夜国内精品a一区二区桃色| 午夜wwww| 精品99在线视频| 日本免费电影一区二区| 偷拍自中文字av在线| 91超碰caoporm国产香蕉| 久久精品亚洲一区二区三区画质| 午夜免费一级片| 日韩精品中文字| 国产亚洲精品久久久久久网站| 热99re久久免费视精品频软件| 午夜亚洲影院| 国产99久久久国产精品免费看| 中文乱幕日产无线码1区| 视频一区二区三区中文字幕| 亚洲乱视频| 国产精品久久久爽爽爽麻豆色哟哟| 日本aⅴ精品一区二区三区日| 国产99久久久久久免费看| 国产精品一区在线观看| 淫片免费看| 999久久久国产| 波多野结衣巨乳女教师| 精品久久不卡| 91社区国产高清| 国产精品一区一区三区| 日韩精品久久一区二区三区| 欧美日韩一区二区三区不卡视频| 欧美国产一区二区三区激情无套| 国产日韩欧美精品一区| 亚洲一二三四区| 亚洲国产精品网站| 国产色一区二区| 国产美女三级无套内谢| 国产欧美精品va在线观看| 亚洲国产另类久久久精品性| 国产69精品久久久久999天美| 国产欧美日韩亚洲另类第一第二页| 午夜激情在线| 久久精品一| 久久精品一二三| 高清欧美精品xxxxx在线看| 国产精品九九九九九九| 午夜特片网| 欧美激情精品久久久久久免费| 色婷婷精品久久二区二区6| 国产精品视频1区2区3区| 99精品黄色| 国产女性无套免费看网站| 国产一区免费在线观看| 色乱码一区二区三在线看| 精品国产区一区二| 国产精品一区二| 欧美日韩一级在线观看| 一本色道久久综合亚洲精品图片| 国产在线不卡一区| 国产免费第一区| 午夜看片在线| 日韩偷拍精品| 日韩精品中文字幕一区| 欧美日韩国产精品一区二区| 99精品国产一区二区三区不卡| 亚洲国产精品一区二区久久hs | 亚洲欧美日韩三区| 又黄又爽又刺激久久久久亚洲精品| 91久久国产露脸精品国产| 日本xxxxxxxxx68护士| 欧美精品一区二区三区视频| 欧美日韩国产在线一区| 国产69精品久久久久久野外| 狠狠色噜噜狠狠狠狠2021天天| 日韩午夜一区| 丝袜诱惑一区二区三区| 另类视频一区二区| 国产一级在线免费观看| 国产精品日产欧美久久久久| 欧美激情国产一区| 亚洲w码欧洲s码免费| 91精品国产高清一区二区三区| 国内久久精品视频| 国产精品国产三级国产专区51区| 免费在线观看国产精品| 精品一区在线观看视频| 中文在线√天堂| 日本美女视频一区二区三区| 欧美乱码精品一区二区| 狠狠综合久久av一区二区老牛| 欧美精选一区二区三区| 久久99国产精品久久99| 日韩欧美高清一区| 欧美高清性xxxxhdvideos| 日韩中文字幕久久久97都市激情| 亚洲乱码一区二区三区三上悠亚| 国产二区免费| 国产激情二区| 国产精品亚发布| 国产午夜一级一片免费播放| 欧美hdxxxx| 欧美国产在线看| 国产欧美一区二区三区免费| 国产一区在线免费观看| 91高清一区| 蜜臀久久99精品久久久久久网站| 对白刺激国产对白精品城中村| 亚洲精品色婷婷| 国产二区不卡| 国产精品国产三级国产播12软件| 色综合久久精品| 99久久免费毛片基地| 国产亚洲精品精品国产亚洲综合| 久久久国产精品一区| 538国产精品| 国产在线观看二区| 午夜电影一区| 高清国产一区二区三区| 欧美在线观看视频一区二区| 久久99精品久久久秒播| 欧美日韩一区二区三区69堂| 精品一区二区三区自拍图片区| 久久婷婷国产香蕉| 亚洲精品中文字幕乱码三区91| 91久久精品国产91久久性色tv| 99精品少妇| 日日夜夜亚洲精品| 狠狠色噜噜狠狠狠狠黑人| 国产亚洲精品久久网站| 日本一区二区欧美| 精品一区二区超碰久久久| 午夜精品999| 自拍偷在线精品自拍偷写真图片| 欧美资源一区| 97视频一区| 精品a在线| 国产农村妇女精品一区二区| 午夜666| 日韩精品一区中文字幕| 日韩欧美国产高清91| 欧美一级不卡| 日韩偷拍精品| 午夜免费av电影| 日韩国产欧美中文字幕| 国产99久久九九精品免费| 欧美髙清性xxxxhdvid| 免费午夜片| 久久国产精品麻豆| 国产第一区在线观看| 久久精品一| 精品久久久久久中文字幕大豆网 | 色噜噜狠狠一区二区| 国产精品久久久区三区天天噜| 日韩欧美精品一区二区| 亚洲欧美色图在线| 国产婷婷一区二区三区久久| 日本不卡精品| 欧美乱妇在线观看| 久久国产精品精品国产| 国产精品69久久久| 97香蕉久久国产超碰青草软件| 欧美在线视频一二三区| 中文字幕一级二级三级| 日韩午夜三级| 日韩精品少妇一区二区在线看| 狠狠色综合久久婷婷色天使| 欧美一区久久久| 欧美日韩一区在线视频| 亚洲乱在线| 精品国产九九九| 国产第一区在线观看| 久久国产麻豆| 国产在线不卡一| 国产69精品久久久久999小说| 国产电影精品一区| 伊人av中文av狼人av|