日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于領域分類的反向翻譯數據構建及訓練方法在審

專利信息
申請號: 202310386735.1 申請日: 2023-04-12
公開(公告)號: CN116306703A 公開(公告)日: 2023-06-23
發明(設計)人: 史曉東;宋佳欣;陳毅東 申請(專利權)人: 廈門大學
主分類號: G06F40/58 分類號: G06F40/58;G06N3/08;G06F16/35;G06F18/22;G06F18/214;G06F40/216;G06N3/0464;G06N3/0499
代理公司: 廈門南強之路專利事務所(普通合伙) 35200 代理人: 馬應森
地址: 361005 福建*** 國省代碼: 福建;35
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 領域 分類 反向 翻譯 數據 構建 訓練 方法
【權利要求書】:

1.一種基于領域分類的反向翻譯數據構建及訓練方法,其特征在于包括以下步驟:

1)基于原語料訓練雙語模型:使用Transformer神經網絡模型,將雙語原語料分別作為源端-目標端和目標端-源端訓練兩個神經機器翻譯模型,

2)基于關鍵詞和主題相似性構建領域單語數據集;

3)基于反向翻譯生成領域偽平行數據集:將步驟2)獲取的領域單語數據集作為源端數據集,使用步驟1)中訓練好的雙語模型進行反向翻譯獲得偽句子對,整理對齊后形成領域偽平行數據集;

4)基于領域分類學習的聯合訓練:將步驟3)所得偽平行數據集標記為領域語料與通用數據進行聯合訓練。

2.如權利要求1所述一種基于領域分類的反向翻譯數據構建及訓練方法,其特征在于在步驟1)中,所述基于原語料訓練雙語模型的具體步驟為:

語言模型基于開源Transformer的神經網絡模型,該模型基于self-attention的編碼器-解碼器模型,由輸入、編碼、解碼、輸出四個模塊組成;輸入模塊將訓練文件中讀出的輸入的文本序列Input={s1,s2,s3,…,st},st代表第i個單詞,獲得初始化詞嵌入并與位置編碼連接后得到輸入向量Input?Embedding={x1,x2,…,xt},送入編碼器;編碼器每一層由多頭注意力機制,前饋神經網絡組成,規范化層,殘差連接組成,其中核心模型為多頭注意力機制由注意力機制演化而來,表達式為:

在編碼器得到輸入的抽象特征表示后,將其輸入到解碼器中進行解碼;解碼器與編碼器結構基本一致,反過來執行將目標嵌入、編碼器狀態、解碼器狀態聯系起來進行解碼;解碼結果經過一個線性層和softmax層輸出為標簽整體的概率分布;對于機器翻譯雙語模型而言,常用的訓練損失函數為交叉熵損失;基于該模型的使用,將整理好的高質量的原始雙語數據集S進行對齊、分詞、BPE、統計詞表、訓練集分割等預處理后,分布訓練一個單向模型;基于構造的雙語模型,用原始語料進行訓練,得到兩個雙語模型。

3.如權利要求1所述一種基于領域分類的反向翻譯數據構建及訓練方法,其特征在于在步驟2)中,所述基于關鍵詞和主題相似性構建領域單語數據集的具體步驟為:

尋找領域相關的篇章中即通過文檔主題相似性擴展數據集,以避免逐句選擇的低效性;對任意一個領域,領域內頻繁出現的關鍵詞可以代表這個領域的主題,但需要排除掉一些代詞,人名等無意義詞匯,可以通過程序自動獲取的方式構建,具體構建方法:

(1)構建一個基本詞庫,使用python工具包對現有領域數據集進行詞頻統計,獲取前500個常用詞匯中后人工篩選出一個詞庫,過濾掉一些常用詞匯,得到一個大小為256的基本詞庫作為領域主題代表D=[d1,d2,…,dn],di表示第i個單詞;

(2)提取文檔的主題,它和上述過程相似,也可以通過詞頻統計的方式獲取;對文檔庫中任意一篇文章P=[p1,p2,p3…,pn],pi代表第i個句子;執行內容選擇,提取文檔的重要句子,提供兩種提取方式的混合,一是基于主要結構的提取,通常來說,一篇文檔的重要部分主要集中在標題、首段和尾端,按照慣例提取這些部分;二是選擇包含某些信息性關鍵詞的句子進行提取;通過兩種方式的提取構成子集P1并滿足提取總數約束,通用將這些句子進行詞頻統計過濾獲得文章關鍵詞代表集合Ds=[dp1,dp2,…,dpn];通過這樣的方式,主題相似性可以轉化為兩個代表主題的關鍵詞集合的相似性,可以通過向量表示的方式來計算二者的相似性;

(3)將使用BERT詞向量將D和Ds轉化為向量表示,將所有詞向量求和獲得主題向量表示和

使用皮爾森相關系數來表示兩者的相似度,用于判斷文本主題與詞庫中詞語的相似度,計算公式為:

對整個文檔庫中所有文檔進行相似度計算,取文檔庫中10%的文檔作為領域相關數據候選集,基于正則表達式切分文檔并進行去重過濾后構建獲得新的領域單語數據集

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310386735.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 精品一区二区三区影院| 午夜精品一区二区三区在线播放| 老太脱裤子让老头玩xxxxx| 一区二区三区国产精品| 国产一级二级在线| 91丝袜诱惑| 久久福利视频网| 国产精品欧美一区乱破| 亚洲精品乱码久久久久久麻豆不卡| 夜夜躁人人爽天天天天大学生| 久久精品99国产国产| 国产午夜精品理论片| 午夜国产一区二区三区| 久久精品二| 高清国产一区二区| 国产精品伦一区二区三区视频| 国产精品久久久久久av免费看| 国产午夜亚洲精品羞羞网站| 中文av一区| 性old老妇做受| 亚洲少妇中文字幕| 中文乱码在线视频| 久久亚洲精品国产一区最新章节| 国产一区二区黄| 人人玩人人添人人澡97| 国产精品一区在线观看你懂的 | 国产午夜精品av一区二区麻豆| 狠狠综合久久av一区二区老牛| 亚洲国产精品入口| 精品久久9999| 狠狠色噜噜狠狠狠狠奇米777| 午夜毛片在线观看| 国产精品久久久久久久龚玥菲| 国产一区二区91| 免费a级毛片18以上观看精品| 国产农村妇女精品一区二区 | 国产真裸无庶纶乱视频| 国模少妇一区二区三区| 午夜影院色| 国产69精品久久久久999小说| 精品视频久| 91理论片午午伦夜理片久久| 大桥未久黑人强制中出| 美女脱免费看直播| 欧美乱大交xxxxx| 最新日韩一区| 欧美乱大交xxxxx古装| 国产欧美www| 国产88av| 国产午夜一级一片免费播放| 国产无遮挡又黄又爽又色视频 | 国产精品久久久久四虎| 夜夜躁日日躁狠狠久久av| 中文字幕一区二区三区四| 欧美日韩亚洲另类| 国产性猛交| 中文字幕日韩有码| 91精品www| 大伊人av| 久久九九亚洲| 午夜特片网| 国产一区三区四区| 91久久国产露脸精品国产| 午夜a电影| 日韩午夜三级| 国产在线一二区| 午夜特片网| 午夜特片网| 在线电影一区二区| 久久激情影院| 黄色香港三级三级三级| 91久久国产露脸精品国产护士| 国产极品美女高潮无套久久久| 精品国产免费久久| 国产精品天堂| 久久精品综合视频| 国产高清精品一区| 日韩午夜电影院| 一区二区在线精品| 欧美午夜理伦三级在线观看偷窥| 一区二区免费播放| 一区二区精品在线| 19videosex性欧美69| 肥大bbwbbwbbw高潮| 一区二区三区欧美精品| 中文字幕一区2区3区| 97久久精品人人做人人爽50路| 欧美一区二区久久| 国产999精品视频| 99久久精品一区二区| 亚洲乱视频| 欧洲精品一区二区三区久久| 26uuu亚洲电影在线观看| 91精品视频一区二区| 国产麻豆91视频| 欧美色综合天天久久| 国产经典一区二区三区| 国产人伦精品一区二区三区| 欧美精品九九| 免费超级乱淫视频播放| 国产一区二区高清视频| 国产高清无套内谢免费| 久久久久亚洲国产精品| 国产一区二区在| 狠狠色噜噜狠狠狠狠奇米777| 亚洲精品久久久久不卡激情文学| 国产精品免费一区二区区| 99久久精品国产国产毛片小说| 91狠狠操| 国产区一二| 毛片免费看看| 欧美日韩精品在线播放| 精品国产鲁一鲁一区二区作者| 国产精品综合一区二区三区| 国产麻豆一区二区三区在线观看 | 69精品久久| 国产性猛交| 激情欧美一区二区三区| 日韩精品一二区| 色噜噜狠狠色综合中文字幕| 制服.丝袜.亚洲.另类.中文| 中文字幕一区二区三区不卡| 欧美久久久一区二区三区| 狠狠躁狠狠躁视频专区| 日韩精品一区二区中文字幕| 一二三区欧美| 久久精品入口九色| 91麻豆精品国产91久久久资源速度| 一区二区三区国产精品| 波多野结衣女教师电影| 一区二区三区在线观看国产| 亚洲国产99| 国产伦精品一区二区三区免| 国产精品久久久久久久久久久久冷| 夜夜嗨av一区二区三区中文字幕 | 欧美精品一区久久| 国产精品久久久久久久新郎| 国产韩国精品一区二区三区| 人人澡超碰碰97碰碰碰| 欧美性猛交xxxxxⅹxx88| 国产二区免费视频| 欧美日韩国产精品一区二区 | 国产一区二区黄| 色噜噜狠狠狠狠色综合久| 26uuu色噜噜精品一区二区| 国产精品一区二区免费| 国产精一区二区| 国产偷久久一区精品69| 欧美极品少妇| 国产91久| 国产大片黄在线观看私人影院 | 91国偷自产中文字幕婷婷| 亚洲欧洲日韩av| 性精品18videosex欧美| 日韩偷拍精品| 国产精品久久久久免费a∨大胸| 国产精品国产三级国产播12软件| 国产精品三级久久久久久电影| 欧美一区二区三区在线视频播放| 欧美一区二区免费视频| 国产一二区视频| 久久综合伊人77777麻豆| 91精品夜夜| 欧美日韩国产免费观看| 久久人人精品| 欧美性猛交xxxxxⅹxx88| 久久一区二区精品| 欧美高清性xxxx| 中文字幕欧美一区二区三区 | 久久精品色欧美aⅴ一区二区| 99久久婷婷国产综合精品电影| 国产精品视频1区| 亚洲国产精品激情综合图片| 精品中文久久| 国产亚洲精品久久久久动| 性欧美精品动漫| 91精品国产综合久久福利软件| 欧美精品在线视频观看| 国产偷自视频区视频一区二区| 亚洲三区二区一区| 欧美在线一级va免费观看| 国产精品久久久久久久久久不蜜月| 国产欧美一区二区三区精品观看| 国产欧美一区二区三区免费看| 国产高清一区二区在线观看| 久久99久国产精品黄毛片入口 | 日韩国产精品久久久久久亚洲| 国产69精品久久久久777| 97人人模人人爽人人喊小说 | 亚洲国产精品国自产拍av| 欧美网站一区二区三区| 四虎国产精品久久| 少妇久久免费视频| 欧美日韩国产一区二区三区在线观看| 91久久国语露脸精品国产高跟| 国产理论一区| 日韩精品免费一区二区夜夜嗨| 国产精品久久久久激情影院| www色视频岛国| 亚洲va国产2019| 精品久久不卡| 97人人模人人爽人人喊38tv| 国产午夜精品免费一区二区三区视频| 综合久久一区二区三区| 欧美极品少妇xxxxⅹ| 欧美精品乱码视频一二专区 | xoxoxo亚洲国产精品| 最新日韩一区| 亚洲第一天堂久久| 国产一区二区伦理片| 欧美一区二区三区在线视频观看| 亚洲欧美日韩精品在线观看| 国产999精品视频| 久久久久偷看国产亚洲87| 色噜噜狠狠色综合中文字幕 | 日本精品三区| 国产日韩欧美二区| 国产精品乱码一区二区三区四川人| 国偷自产一区二区三区在线观看| 国产九九九精品视频| 日本一级中文字幕久久久久久| 天堂av色婷婷一区二区三区| 国产欧美日韩精品一区二区三区| 国产在线精品区| 公乱妇hd在线播放bd| 国产一区二区电影在线观看| 亚洲精品久久久久999中文字幕 | 人人澡超碰碰97碰碰碰| 精品国产二区三区| 国产精品美女久久久免费| 狠狠色噜噜狠狠狠狠奇米777| 国产精品理人伦一区二区三区 | 精品视频在线一区二区三区| 国产精品亚洲精品| 午夜免费av电影| 日韩精品免费一区二区在线观看| 久久一级精品视频| 日本aⅴ精品一区二区三区日| 国产精一区二区| 91亚洲欧美日韩精品久久奇米色 | 国产91电影在线观看| 久久精品男人的天堂| 国产一区二区日韩| 亚洲va欧美va国产综合先锋| 国产特级淫片免费看| 狠狠色狠狠色88综合日日91|