日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法在審

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 201710031471.2 申請(qǐng)日: 2017-01-17
公開(kāi)(公告)號(hào): CN106874263A 公開(kāi)(公告)日: 2017-06-20
發(fā)明(設(shè)計(jì))人: 程國(guó)艮;宋金平 申請(qǐng)(專(zhuān)利權(quán))人: 中譯語(yǔ)通科技(北京)有限公司
主分類(lèi)號(hào): G06F17/28 分類(lèi)號(hào): G06F17/28;G06F17/27
代理公司: 北京萬(wàn)貝專(zhuān)利代理事務(wù)所(特殊普通合伙)11520 代理人: 馬紅
地址: 100040 *** 國(guó)省代碼: 北京;11
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 多維 度數(shù) 分析 語(yǔ)義 英語(yǔ) 校對(duì) 方法
【說(shuō)明書(shū)】:

技術(shù)領(lǐng)域

發(fā)明屬于統(tǒng)計(jì)機(jī)器翻譯技術(shù)領(lǐng)域,尤其涉及一種基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法。

背景技術(shù)

統(tǒng)計(jì)機(jī)器翻譯主要包括翻譯模型和語(yǔ)言模型兩大部分,其中翻譯模型由雙語(yǔ)平行語(yǔ)料庫(kù)訓(xùn)練而來(lái),語(yǔ)言模型由目標(biāo)語(yǔ)言單語(yǔ)語(yǔ)料訓(xùn)練而來(lái),統(tǒng)計(jì)機(jī)器翻譯引擎的質(zhì)量在很大程度上取決于用來(lái)訓(xùn)練的雙語(yǔ)平行語(yǔ)料庫(kù)的質(zhì)量。國(guó)外有研究表明,經(jīng)過(guò)校對(duì)的高質(zhì)量的1000萬(wàn)句對(duì)的雙語(yǔ)語(yǔ)料和未經(jīng)校對(duì)的8000萬(wàn)句對(duì)的語(yǔ)料所訓(xùn)練出來(lái)的引擎翻譯質(zhì)量相當(dāng)。由于雙語(yǔ)平行語(yǔ)料一般數(shù)量龐大,動(dòng)輒數(shù)千萬(wàn)甚至上億句對(duì),而且來(lái)源復(fù)雜。

綜上所述,現(xiàn)有技術(shù)的存在的問(wèn)題是:雙語(yǔ)平行語(yǔ)料數(shù)量來(lái)源復(fù)雜造成校對(duì)不正確和不整齊。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法,旨在解決雙語(yǔ)平行語(yǔ)料數(shù)量來(lái)源復(fù)雜造成校對(duì)不正確和不整齊的問(wèn)題。

本發(fā)明是這樣實(shí)現(xiàn)的,一種基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法,所述基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法為:利用規(guī)則機(jī)器翻譯引擎,將語(yǔ)料庫(kù)中的英語(yǔ)句子翻譯成中文;然后此中文和語(yǔ)料庫(kù)中的中文句子進(jìn)行匹配;根據(jù)匹配率,輔以距離、長(zhǎng)度、編號(hào)多維度數(shù)據(jù)分析特征,找出不匹配的句對(duì),留下準(zhǔn)確的句對(duì),從而校對(duì)出正確的語(yǔ)料庫(kù)。

進(jìn)一步,所述基于多維度數(shù)據(jù)分析和語(yǔ)義的中英語(yǔ)料庫(kù)校對(duì)方法具體包括以下步驟:

檢查英文句子中是否存在漢字,通過(guò)漢字內(nèi)碼表,自動(dòng)取出英文句子中存在漢字的句子;

檢查英中句子長(zhǎng)度是否匹配,計(jì)算英文句子的長(zhǎng)度和漢語(yǔ)句子的長(zhǎng)度的比值,其中英文句子長(zhǎng)度就是句子中英文字符的數(shù)量,漢語(yǔ)句子長(zhǎng)度就是句子中漢字的數(shù)量,就是然后設(shè)定一個(gè)閾值,超出該閾值范圍的不匹配,閾值比值范圍為:0.4≤閾值比值≤6;

檢查句子是否超長(zhǎng),計(jì)算句子中英文句子的長(zhǎng)度和漢語(yǔ)句子的長(zhǎng)度,用于統(tǒng)計(jì)機(jī)器翻譯訓(xùn)練的句子中,漢語(yǔ)句子長(zhǎng)度大于500或英語(yǔ)句子長(zhǎng)度大于800為超長(zhǎng)句子,去掉;

檢查漢語(yǔ)句子中的英文是否太多,計(jì)算漢語(yǔ)句子中英文字符的數(shù)量,用于統(tǒng)計(jì)機(jī)器翻譯訓(xùn)練的句子,訓(xùn)練出的翻譯模型為中英短語(yǔ)對(duì),一個(gè)漢語(yǔ)句子中含有非漢字和標(biāo)點(diǎn)的字符數(shù)超過(guò)40,將非漢字和標(biāo)點(diǎn)去掉;

檢查漢語(yǔ)句子中漢字是否太少,計(jì)算漢語(yǔ)句子中漢字的數(shù)量,用于統(tǒng)計(jì)機(jī)器翻譯訓(xùn)練的句子,訓(xùn)練出的翻譯模型是中英短語(yǔ)對(duì),漢語(yǔ)句子中漢字?jǐn)?shù)量少于2,該句子不合格;

檢查圓括號(hào)是否匹配,首先檢查英文句子的圓括號(hào)是否配對(duì),然后檢查漢語(yǔ)句子的圓括號(hào)是否配對(duì),再檢查英文句子和漢語(yǔ)句子雙方的圓括號(hào)是否配對(duì);計(jì)算英文句子中左圓括號(hào)的數(shù)量,再計(jì)算英文句子中右圓括號(hào)的數(shù)量,看兩者數(shù)量是否相等;計(jì)算漢語(yǔ)句子中左圓括號(hào)的數(shù)量,再計(jì)算漢語(yǔ)句子中右圓括號(hào)的數(shù)量,看兩者數(shù)量是否相等;計(jì)算英語(yǔ)句子中左圓括號(hào)的數(shù)量,再計(jì)算漢語(yǔ)句子中左圓括號(hào)的數(shù)量,看兩者數(shù)量是否相等;計(jì)算英語(yǔ)句子中右圓括號(hào)的數(shù)量,再計(jì)算漢語(yǔ)句子中右圓括號(hào)的數(shù)量,看兩者數(shù)量是否相等;

檢查方括號(hào)是否匹配,首先檢查英文句子的方括號(hào)是否配對(duì),然后檢查漢語(yǔ)句子的方括號(hào)是否配對(duì),再檢查英文句子和漢語(yǔ)句子雙方的方括號(hào)是否配對(duì);

檢查句首項(xiàng)目符號(hào)與編號(hào)是否匹配,對(duì)原文和譯文部分句首項(xiàng)目符號(hào)與編號(hào)不匹配的進(jìn)行校正;如果原文句首有項(xiàng)目符號(hào)與編號(hào),而譯文句首沒(méi)有項(xiàng)目符號(hào)與編號(hào),則將原文的句首項(xiàng)目符號(hào)與編號(hào)刪除掉;如果譯文句首有項(xiàng)目符號(hào)與編號(hào),而原文句首沒(méi)有項(xiàng)目符號(hào)與編號(hào),則將譯文的句首項(xiàng)目符號(hào)與編號(hào)刪除掉;

檢查數(shù)字是否正確,檢查語(yǔ)料庫(kù)中數(shù)字是否錯(cuò)誤,以及檢查原譯文數(shù)字不相匹配的錯(cuò)誤;采用查找關(guān)鍵詞“C:D:D||C:D:D||C:^D1&&!E:^D1”的方法,找出問(wèn)題句對(duì);其中C:代表在漢語(yǔ)句子中查找,D代表任意數(shù)字,為多個(gè)數(shù)字;D:D代表數(shù)字,:為數(shù)字的模式,^代表句首,D1代表一個(gè)數(shù)字;||為邏輯或運(yùn)算,&&為邏輯與運(yùn)算,!為邏輯非運(yùn)算;C:^D1&&!E:^D1表示漢語(yǔ)句子以數(shù)字開(kāi)始,同時(shí)其對(duì)應(yīng)英文句子不是以數(shù)字開(kāi)始;

檢查各種亂碼,根據(jù)漢字的內(nèi)碼表和提取一個(gè)全部由亂碼組成的關(guān)鍵字文件檢查各種亂碼;

語(yǔ)義校對(duì),對(duì)語(yǔ)料庫(kù)進(jìn)行語(yǔ)義校對(duì)是本發(fā)明的重點(diǎn),方法是采用英漢規(guī)則機(jī)器翻譯引擎對(duì)句對(duì)中的英文句子進(jìn)行翻譯,得到中文譯文,然后將該譯文和該句對(duì)中的中文進(jìn)行相似度計(jì)算,相似度低于某個(gè)閾值的認(rèn)為是不合格句對(duì)。

進(jìn)一步,檢查各種亂碼中,采用兩種方法檢查亂碼,具體包括:

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中譯語(yǔ)通科技(北京)有限公司,未經(jīng)中譯語(yǔ)通科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710031471.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲欧美视频一区二区| 欧美色综合天天久久| 视频二区狠狠色视频| 国久久久久久| 久久网站精品| 99热一区二区| 精品少妇一区二区三区免费观看焕| 一区二区在线不卡| 中文字幕一区一区三区| 国产精品久久久久久久久久软件| 日本一区免费视频| 亚洲欧美日本一区二区三区 | 精品久久久久99| 色综合久久网| 久久99精| 精品国产乱码一区二区三区在线| 好吊妞国产欧美日韩免费观看网站| 国产va亚洲va在线va| 日韩亚洲欧美一区二区| 国产全肉乱妇杂乱视频在线观看| 久久99国产视频| 久久97国产| 色吊丝av中文字幕| 玖玖国产精品视频| 欧美一区二区免费视频| 亚洲一二三四区| 蜜臀久久99静品久久久久久| 精品一区中文字幕| 国产精品电影一区| 欧美日韩一区电影| 国产精品久久久久久久久久久久久久久久| 欧美高清视频一区二区三区| xoxoxo亚洲国产精品| 欧美777精品久久久久网| 精品国产一区二区三区四区vr| 国产精品久久久久久久久久久久久久不卡 | 日韩一区高清| 日韩精品一区二区中文字幕| 国产精品久久久久久久久久不蜜臀| 欧美高清性xxxxhdvideos| 伊人久久婷婷色综合98网| 夜夜夜夜曰天天天天拍国产| 色婷婷久久一区二区三区麻豆 | 日韩精品中文字幕一区二区三区| 欧美黄色一二三区| 亚洲1区在线观看| 亚洲激情中文字幕| 人人玩人人添人人澡97| 大伊人av| 中文字幕一区二区三区不卡| 91夜夜夜| 91秒拍国产福利一区| 国产理论一区| 天天干狠狠插| 国产日韩精品一区二区| 99精品欧美一区二区| 国产在线拍揄自揄拍| 国产精一区二区三区| 国产91高清| 午夜av资源| 亚洲精品456| 国产麻豆精品一区二区| 国产精品久久久久久久久久久新郎| 精品久久久久久亚洲综合网| 国产日韩精品一区二区| 欧美精品国产精品| 国产精品香蕉在线的人| 国产在线播放一区二区| 精品少妇一区二区三区免费观看焕| 免费观看又色又爽又刺激的视频| 亚洲伊人久久影院| 欧美日韩国产专区| 国产在线观看免费麻豆| 午夜av在线电影| 日本精品三区| 综合久久一区二区三区| 日韩av中文字幕在线| 538在线一区二区精品国产| 亚洲精品一区在线| 久爱精品视频在线播放| 亚洲欧美日韩精品suv| 欧美精品一区二区三区视频| 久久国产免费视频| 日韩无遮挡免费视频| 国产欧美一区二区三区免费视频| 国产一级在线免费观看| 欧美精品久| 日本精品三区| 精品99在线视频| 国产精品久久国产三级国电话系列| 久久99国产视频| 一二三区欧美| 91精品久久久久久久久久| 国产伦精品一区二| 亚洲欧美一区二区三区三高潮| 91麻豆精品国产91久久| 国产aⅴ精品久久久久久| 国产精品视频一区二区在线观看| 欧美乱妇在线视频播放| 欧美老肥婆性猛交视频| 一区二区三区欧美日韩| 国产精品久久人人做人人爽| 精品国产一区二区三区麻豆免费观看完整版| 日韩午夜电影院| 亚洲精品www久久久| 久久久久久亚洲精品| 亚洲国产精品肉丝袜久久| 91丝袜国产在线观看| www.久久精品视频| 日韩一区二区中文字幕| 欧美精选一区二区三区| 久久国产精品首页| 日韩av三区| 精品婷婷伊人一区三区三| 国产视频一区二区不卡| 日本边做饭边被躁bd在线看| 欧美乱妇在线视频播放| 国产性生交xxxxx免费| 日韩av在线影院| 国产一级不卡毛片| 97欧美精品| 国产不卡一区在线| 日韩精品在线一区二区三区| 欧美一区二区三区久久| 福利电影一区二区三区| 国产清纯白嫩初高生在线播放性色 | 日韩午夜毛片| 久久精视频| 国产人成看黄久久久久久久久| 亚洲一区二区福利视频| 欧美日韩一二三四区| 国产一卡二卡在线播放| 精品国产亚洲一区二区三区| 欧美资源一区| 欧美色综合天天久久| 激情久久一区| 午夜av男人的天堂| 国产第一区在线观看| 欧美一区二区三区高清视频| 69久久夜色精品国产69–| 欧美国产三区| 思思久久96热在精品国产| 国产视频在线一区二区| 免费a级毛片18以上观看精品| 在线观看欧美一区二区三区| 中文字幕欧美一区二区三区 | 天堂av一区二区| 91精品视频一区二区| 国产一区二三| 色一情一乱一乱一区99av白浆| 欧美激情在线观看一区| 小萝莉av| 大bbw大bbw巨大bbb| 日韩av在线影院| 日韩av不卡一区二区| 欧美日韩久久一区二区| 国产一区二区三区小说| 国产日产欧美一区二区| 夜夜嗨av一区二区三区中文字幕 | 欧美在线一区二区视频| 狠狠色噜噜狼狼狼色综合久| 国产免费区| 91久久国产露脸精品国产| 国产精品白浆视频| 国产在线观看免费麻豆| 国产免费一区二区三区四区| 午夜剧场a级片| 午夜影院一级片| **毛片免费| 亚洲欧美制服丝腿| 少妇高潮在线观看| 玖玖爱国产精品| 午夜毛片在线观看| 国产精品96久久久久久久 | av素人在线| 欧美精品乱码视频一二专区 | 久久狠狠高潮亚洲精品| 亚洲国产欧美国产综合一区| 日韩欧美国产高清91| 国产一区二区大片| 狠狠色狠狠色综合久久第一次| 午夜片在线| 在线观看欧美日韩国产| 中文字幕+乱码+中文字幕一区| 欧美视屏一区| 国产精品一二三区免费| 国产一区在线免费| 久久国产精品二区| 亚洲精品久久在线| 91久久久久久亚洲精品禁果| 国产欧美久久一区二区三区| 国产黄色网址大全| 亚洲欧美日本一区二区三区 | 99国产精品丝袜久久久久久| 欧美日韩一级在线观看| 亚洲国产欧美一区| 国产伦精品一区二区三区电影 | 亚洲少妇一区二区三区| 国产又色又爽无遮挡免费动态图| 一色桃子av大全在线播放| 精品国产乱码久久久久久软件影片| 日韩中文字幕久久久97都市激情| 久久精品视频中文字幕| 亚洲国产99| 久久久久亚洲国产精品| 欧美一区二区三区不卡视频| 狠狠色噜噜狠狠狠888奇米| 亚洲欧美一区二区精品久久久| 91久久精品国产亚洲a∨麻豆| 久久国产欧美视频| 亚洲欧美日韩国产综合精品二区 | 欧美精品国产精品| 国产精品v欧美精品v日韩| 国产91热爆ts人妖系列| 精品一区欧美| 免费午夜在线视频| 国产69精品久久久久按摩| 日韩精品中文字幕在线| 久久久久偷看国产亚洲87| 国产99久久久久久免费看| 精品视频在线一区二区三区| 美女被羞羞网站视频软件| 狠狠色噜噜狠狠狠狠2021天天| 国产主播啪啪| 狠狠色狠狠色合久久伊人| 中文字幕一区二区三区乱码| 国产一级片自拍| 国产91综合一区在线观看| 国产乱色国产精品播放视频| 国产女人与拘做受免费视频| 欧美精品一区免费| 亚洲精品日本久久一区二区三区| 狠狠色狠狠色综合日日2019| 欧美日韩精品在线一区二区| 国产欧美一区二区三区四区| 欧美一区二区三区久久精品视| 久久精品一区二区三区电影| 午夜电影理伦片2023在线观看| 欧美日韩国产精品一区二区| 国产一区二区三区中文字幕| 精品99免费视频| 日韩av在线电影网| 亚洲理论影院| 欧美亚洲精品suv一区| 国产在线不卡一| 久草精品一区|