日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于對(duì)比學(xué)習(xí)的新聞冗余判斷方法、裝置及設(shè)備在審

專利信息
申請(qǐng)?zhí)枺?/td> 202211390604.2 申請(qǐng)日: 2022-11-08
公開(kāi)(公告)號(hào): CN115659944A 公開(kāi)(公告)日: 2023-01-31
發(fā)明(設(shè)計(jì))人: 張?jiān)反?/a>;張澤宇;譚智雄 申請(qǐng)(專利權(quán))人: 張?jiān)反?/a>;張澤宇
主分類號(hào): G06F40/194 分類號(hào): G06F40/194;G06F40/284;G06F40/30;G06F18/214;G06F18/22;G06N3/0455;G06N3/088
代理公司: 哈爾濱市陽(yáng)光惠遠(yuǎn)知識(shí)產(chǎn)權(quán)代理有限公司 23211 代理人: 劉景祥
地址: 102401 北*** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 對(duì)比 學(xué)習(xí) 新聞 冗余 判斷 方法 裝置 設(shè)備
【說(shuō)明書】:

發(fā)明公開(kāi)了一種基于對(duì)比學(xué)習(xí)的新聞冗余判斷方法、裝置及設(shè)備,涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,解決了現(xiàn)有技術(shù)中新聞冗余判斷方法應(yīng)用范圍窄以及成本高的技術(shù)問(wèn)題,主要包括:基于Simbert框架構(gòu)造模型,并定義模型下游任務(wù)以及損失函數(shù);將所述訓(xùn)練集輸入至所述模型進(jìn)行訓(xùn)練;基于所述訓(xùn)練好的模型,計(jì)算所述待判斷新聞文本采用對(duì)比學(xué)習(xí)的方法與所述構(gòu)建的比較環(huán)境中各個(gè)新聞文本的余弦相似度;將所述余弦相似度與預(yù)設(shè)閾值進(jìn)行比較,若存在所述余弦相似度大于所述預(yù)設(shè)閾值的情況,則所述待判斷新聞文本冗余;該方法基于Simbert框架,采用無(wú)監(jiān)督模型訓(xùn)練方法,能夠?qū)崿F(xiàn)低成本的參數(shù)調(diào)整和模型調(diào)整,應(yīng)用于多種場(chǎng)景,符合新聞時(shí)效性強(qiáng)的特點(diǎn)。

技術(shù)領(lǐng)域

本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域。

背景技術(shù)

我們身處信息爆炸的互聯(lián)網(wǎng)時(shí)代,每天傳播的新聞數(shù)以億萬(wàn)計(jì),其中很多新聞都報(bào)道的是同一事件,信息的冗余率很高。對(duì)于需要大量外部信息輔助決策的行業(yè),如金融行業(yè),公司會(huì)采購(gòu)相關(guān)領(lǐng)域的新聞源,但因?yàn)楦鞣娇駸嶙非罅髁康奶攸c(diǎn),新聞的冗余率很高,一般能達(dá)到30%以上。此外,因?yàn)樾侣劦臅r(shí)效性強(qiáng)的特點(diǎn),多數(shù)行業(yè)需要判斷的速度達(dá)到毫秒級(jí)別。

目前,判斷新聞的冗余情況主要分為兩種類型,一種是基于字符的判斷,即簡(jiǎn)單比對(duì)新聞標(biāo)題的字符,計(jì)算相似度,根據(jù)經(jīng)驗(yàn)設(shè)置閾值,最后據(jù)此判斷新聞是否相同。這種方法往往會(huì)需要人工輔助判斷,人工成本高,判斷效果較差。另一種是基于語(yǔ)義的判斷,即根據(jù)新聞標(biāo)題(正文)的語(yǔ)義,計(jì)算相似度,判斷新聞是否相同。這種方法往往需要前期進(jìn)行模型訓(xùn)練,訓(xùn)練出一個(gè)適應(yīng)于實(shí)際領(lǐng)域的模型。這種方法中,一般采用的模型有word2vec、Bert等等,這些都是模型都是有監(jiān)督的,需要前期花費(fèi)時(shí)間和金錢構(gòu)造出一個(gè)有監(jiān)督的訓(xùn)練數(shù)據(jù)集。然而,現(xiàn)實(shí)生活中,原始新聞數(shù)據(jù)是不帶有標(biāo)簽的,而有監(jiān)督的模型訓(xùn)練需要大量的帶標(biāo)簽的數(shù)據(jù),人工為數(shù)以萬(wàn)級(jí)的新聞數(shù)據(jù)打上標(biāo)簽是需要較高的時(shí)間成本和金錢投入的。且因?yàn)椴煌I(lǐng)域的新聞,特征不同,不能用一個(gè)訓(xùn)練好的模型一勞永逸地平移到多個(gè)應(yīng)用場(chǎng)景。在發(fā)展日新月異的時(shí)代,用于表征語(yǔ)義的模型需要定期微調(diào),與時(shí)俱進(jìn),采用有監(jiān)督的模型顯然成本太高。因此,如何以較低的成本,使得訓(xùn)練出的模型既能充分地理解新聞的語(yǔ)義,又能結(jié)合新聞時(shí)效性強(qiáng)的特點(diǎn),實(shí)現(xiàn)新聞冗余情況的準(zhǔn)確判斷,成為本領(lǐng)域亟待解決的技術(shù)問(wèn)題。

發(fā)明內(nèi)容

為了解決現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題,本發(fā)明提供了一種基于對(duì)比學(xué)習(xí)的新聞冗余判斷方法、裝置及設(shè)備,基于Simbert框架,采用無(wú)監(jiān)督模型訓(xùn)練方法,能夠?qū)崿F(xiàn)低成本的參數(shù)調(diào)整和模型調(diào)整,應(yīng)用于多種場(chǎng)景,符合新聞時(shí)效性強(qiáng)的特點(diǎn)。

本發(fā)明提供一種基于對(duì)比學(xué)習(xí)的新聞冗余判斷方法,包括:

S1、獲取新聞文本,并對(duì)所述新聞文本進(jìn)行分詞處理;

S2、采用Simcse無(wú)監(jiān)督訓(xùn)練方法,定義語(yǔ)料生成器;

S3、基于經(jīng)過(guò)分詞處理后的新聞文本,根據(jù)所述語(yǔ)料生成器得到訓(xùn)練集;

S4、基于Simbert框架構(gòu)造語(yǔ)義編碼模型,并定義模型下游任務(wù)以及損失函數(shù);

S5、將所述訓(xùn)練集輸入至所述語(yǔ)義編碼模型進(jìn)行訓(xùn)練;

S6、獲取待判斷新聞文本;

S7、根據(jù)所述待判斷新聞文本的時(shí)間,從新聞庫(kù)中構(gòu)造比較環(huán)境;

S8、基于所述訓(xùn)練好的語(yǔ)義編碼模型,計(jì)算所述待判斷新聞文本與所述新聞庫(kù)中各個(gè)新聞文本的余弦相似度;

S9、將所述余弦相似度與預(yù)設(shè)閾值進(jìn)行比較,若存在所述余弦相似度大于所述預(yù)設(shè)閾值的情況,則所述待判斷新聞文本冗余。

進(jìn)一步地,采用Simcse無(wú)監(jiān)督訓(xùn)練方法,定義語(yǔ)料生成器,包括:

S21、將經(jīng)過(guò)分詞處理后的新聞文本輸入Dropout編碼器,得到第一向量;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于張?jiān)反?張澤宇,未經(jīng)張?jiān)反?張澤宇許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202211390604.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 蜜臀久久99精品久久久| 久久夜色精品久久噜噜亚| 国产欧美一区二区三区免费 | 欧美亚洲精品suv一区| xxxx国产一二三区xxxx| 国产一区二区高清视频| 欧洲激情一区二区| 福利片午夜| 欧美日韩激情一区| 国产精品1区2区| 69久久夜色精品国产69–| 欧美午夜理伦三级在线观看偷窥| 丰满岳乱妇bd在线观看k8| 91精品国产高清一二三四区| 国产一区二区免费在线| 强制中出し~大桥未久10在线播放| 国产一级不卡视频| 国产一区二区三区四| 少妇久久免费视频| 日韩国产精品一区二区| 精品一区电影国产| 精品日韩久久久| 亚洲国产精品二区| 久久99精品久久久野外直播内容| 午夜wwwww| 欧美3p激情一区二区三区猛视频| 国产一区激情| 99久久婷婷国产精品综合| 中文字幕精品一区二区三区在线| 91久久久久久亚洲精品禁果| 日韩无遮挡免费视频| 午夜黄色一级电影| 欧美国产亚洲精品| 色综合久久综合| 午夜一级电影| 色综合久久88| 欧美日韩一区二区三区69堂| 亚洲精品乱码久久久久久高潮| 久久久精品99久久精品36亚| 国产有码aaaae毛片视频| 日本一码二码三码视频| 欧美在线一级va免费观看| 色噜噜日韩精品欧美一区二区| 国产97久久| 久久久人成影片免费观看| 午夜社区在线观看| 国产精品高潮呻吟久| _97夜夜澡人人爽人人| 国产女人和拘做受在线视频| 91精品国产一区二区三区| 久久中文一区二区| 7777久久久国产精品| 国产婷婷一区二区三区久久| 999偷拍精品视频| 性视频一区二区三区| 亚洲一区中文字幕| 国产在线视频二区| 国产日产欧美一区| 性色av色香蕉一区二区| 99久久国产综合| 久久精品一二三| 国产精品一二三四五区| 三上悠亚亚洲精品一区二区| 国产精品视频十区| 日韩a一级欧美一级在线播放| 日本久久不卡| 国产乱人乱精一区二视频国产精品| 国产69精品久久久| 国产麻豆一区二区三区在线观看 | 国产精品一级在线| 国产欧美一区二区三区在线| 久久96国产精品久久99软件| 91一区在线| 91精品一二区| 91精品久久久久久久久久| 国精产品一二四区在线看| 久久福利视频网| 99久久婷婷国产综合精品草原| 91精品色| 国产白丝一区二区三区| 国产欧美日韩精品一区二区图片| 国产精品一级在线| 午夜一区二区视频| 久久久综合亚洲91久久98| **毛片免费| 一区二区在线视频免费观看 | 性欧美一区二区三区| 国产精品96久久久久久久| 国产精品19乱码一区二区三区| 99视频国产在线| 狠狠色丁香久久婷婷综合_中| 少妇久久精品一区二区夜夜嗨| 国产资源一区二区| 精品久久小视频| freexxxx性| 亚洲激情中文字幕| 中文字幕二区在线观看| 国产精品乱战久久久| 玖玖国产精品视频| 国产无遮挡又黄又爽又色视频| 狠狠色噜噜狠狠狠狠米奇777| 国产91精品一区| 国产人伦精品一区二区三区| 日韩精品一区二区三区免费观看 | 欧美日韩一区电影| 亚洲高清毛片一区二区| 中文av一区| 亚洲精品日韩在线| 久久久久久中文字幕| 999久久国精品免费观看网站| 狠狠色狠狠综合久久| 国产精品99一区二区三区| 狠狠色噜噜狠狠狠狠综合久| 一区二区欧美精品| 欧美日韩中文不卡| 国产乱淫精品一区二区三区毛片| 国产一区二三| 日韩av中文字幕在线免费观看| 国产精品久久久视频| 午夜精品一区二区三区在线播放| 免费视频拗女稀缺一区二区| 日韩av在线高清| 国产欧美视频一区二区| 国产69精品久久久久男男系列| 欧美日韩一区二区三区四区五区六区| 欧美三区二区一区| 国产69精品福利视频| 一区二区三区国产精品视频| 国产精品偷乱一区二区三区| 国产91清纯白嫩初高中在线观看| 狠狠色噜噜狠狠狠狠奇米777| 国产精品一区在线观看你懂的 | 野花社区不卡一卡二| 午夜激情综合网| 欧美日韩国产一级| 亚洲s码欧洲m码在线观看| 97人人揉人人捏人人添| 欧美日韩一区二区三区四区五区| 色妞www精品视频| 亚洲精品久久久久中文字幕欢迎你| 国产一区二区黄| 国产69精品99久久久久久宅男| 国产亚洲精品综合一区| 91免费视频国产| 久久五月精品| 日韩一级在线视频| 色噜噜日韩精品欧美一区二区| 久久国产欧美日韩精品| 99精品视频一区二区| 午夜码电影| 日本一区二区免费电影| 亚洲精品少妇一区二区| 久久国产精品首页| 久久精视频| 日韩中文字幕亚洲欧美| 欧美精品一区二区三区久久久竹菊| 国产伦精品一区二区三区无广告| 国产色一区二区| 国产精品自拍在线| 欧美日韩精品在线播放| 91福利视频免费观看| 91精品一区在线观看| 国产色婷婷精品综合在线手机播放| 午夜片在线| 97人人澡人人添人人爽超碰| 91久久国产露脸精品国产护士| 自拍偷在线精品自拍偷无码专区| 精品视频久| 国产一区二区高清视频| 波多野结衣女教师30分钟| 91人人精品| 国产精品自拍在线观看| 狠狠色噜噜狠狠狠狠69| 91一区二区三区在线| 久久夜色精品久久噜噜亚| 视频一区二区三区中文字幕| 99久久99精品| 久久精品国产一区二区三区| 美女直播一区二区三区| 亚洲乱强伦| 四季av中文字幕一区| 69久久夜色精品国产69–| 国产欧美一区二区三区视频| 99视频国产精品| 中文乱码字幕永久永久电影| 欧美国产在线看 | 国产欧美一区二区三区精品观看| av素人在线| 国产在线一区观看| 一区二区三区日韩精品| 亚洲免费永久精品国产| 国产亚洲欧美日韩电影网| 99久久夜色精品| 在线观看v国产乱人精品一区二区| 亚洲国产一区二区精华液| 曰韩av在线| 午夜诱惑影院| 亚洲精品久久久久www| 国产精品国产三级国产专区53| 午夜666| 99久久国产综合精品尤物酒店| 国产69精品久久久久久| 日本一区二区三区中文字幕| 久久精品国产一区二区三区| 婷婷午夜影院| 中文字幕av一区二区三区高| 91精品国产高清一区二区三区| free×性护士vidos欧美| 国产99久久久精品视频| 欧美亚洲视频二区| 激情aⅴ欧美一区二区三区| 欧美精品二区三区| 99久久婷婷国产综合精品电影| 国产二区免费| 欧美乱战大交xxxxx| 性夜影院在线观看| 欧美日韩国产精品一区二区亚洲| 欧美日韩一区视频| 欧美激情午夜| 精品国产一区二区三区麻豆免费观看完整版 | 精品少妇的一区二区三区四区| 97人人模人人爽视频一区二区| 国产精品国产三级国产专区51区| 亚洲国产欧美国产综合一区| 欧美在线一级va免费观看| 狠狠躁天天躁又黄又爽| 99日韩精品视频| 九九久久国产精品| 国产视频一区二区在线播放| 国产精品高潮呻吟三区四区| 国产乱对白刺激视频在线观看| 99久久久国产精品免费无卡顿| 理论片午午伦夜理片在线播放 | 秋霞三级伦理| 精品欧美一区二区在线观看| 国产精品久久久久久久妇女| 国产精品尤物麻豆一区二区三区| 国产高潮国产高潮久久久91| 亚洲欧美国产精品久久| 亚洲va国产2019| 亚洲精品国产主播一区| 欧美精品一区二区三区视频| 日本免费电影一区二区三区| 欧美69精品久久久久久不卡| 国产在线精品二区| 97视频久久久|