日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]獲取語料的方法及裝置、生成翻譯模型的方法及系統、機器翻譯的方法及系統有效

專利信息
申請號: 201110307878.6 申請日: 2011-10-12
公開(公告)號: CN103049436A 公開(公告)日: 2013-04-17
發明(設計)人: 馬艷軍;吳華;王海峰 申請(專利權)人: 北京百度網訊科技有限公司
主分類號: G06F17/28 分類號: G06F17/28;G06F17/30
代理公司: 北京鴻德海業知識產權代理事務所(普通合伙) 11412 代理人: 袁媛
地址: 100085 北京市*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 獲取 語料 方法 裝置 生成 翻譯 模型 系統 機器翻譯
【說明書】:

【技術領域】

發明涉及機器翻譯領域,特別涉及一種獲取語料的方法及裝置、生成翻譯模型的方法及系統、機器翻譯的方法及系統。?

【背景技術】

在機器翻譯中,使用的翻譯模型對翻譯質量有很大的影響,現有的機器翻譯方法中,不對待翻譯文本的類型進行區分,而采用相同的翻譯模型對各種類型的文本進行翻譯,這會導致針對不同類型的文本,翻譯結果的質量出現較大差異的現象。?

例如英語中的“bank”一詞,在經濟、金融領域的上下文中,應該翻譯成“銀行”,而在地理領域的上下文中,則應該翻譯為“河岸”。如果對這些情況不做區分,而采用同一種翻譯模型進行翻譯,就會降低翻譯的質量。?

【發明內容】

本發明所要解決的技術問題是提供一種獲取語料的方法及裝置、生成翻譯模型的方法及系統、機器翻譯的方法及系統,以解決現有技術在對不同領域的文本進行翻譯時,翻譯精度不夠高的缺陷。?

本發明為解決技術問題而采用的技術方案是提供一種獲取語料的方法,包括:將雙語語料中來自相同頁面的雙語句對歸并為一組從而將所述雙語語料劃分為多個歸并語料;從各個歸并語料中選擇長度超過設定閾值的歸并語料組成長語料;采用聚類的方法,將相同領域的長語料聚為一類;利用聚類得到的各領域的長語料訓練分類模型;使用訓練后的分類模型對所述雙語語料中的短語料進行分類,以確定所述短語料所屬領域,并將各領域的短語料與相同領域?的長語料進行合并,得到各領域的訓練語料,其中所述短語料為所述雙語語料中除所述長語料之外的其他語料。?

根據本發明之一優選實施例,所述聚類的方法為潛在概率語義分析方法。?

根據本發明之一優選實施例,對所述長語料進行聚類時采用的聚類特征包括:對所述長語料進行分詞后,各個詞語在所述長語料中出現的次數及各互譯詞對在所述長語料中出現的次數。?

根據本發明之一優選實施例,所述分類模型包括貝葉斯模型、支持向量機模型、K近鄰分類模型或最大熵模型。?

本發明還提供了一種生成翻譯模型的方法,包括:采用上述獲取語料的方法獲取各領域的訓練語料;使用各領域的訓練語料對翻譯模型進行訓練得到各領域翻譯模型。?

根據本發明之一優選實施例,所述方法進一步包括:將各領域的訓練語料合并后對翻譯模型進行訓練得到通用翻譯模型。?

本發明還提供了一種機器翻譯方法,包括:A.使用第一分類模型對待翻譯文本進行分類,以確定所述待翻譯文本所屬領域,其中所述第一分類模型由各領域的訓練語料訓練得到;B.利用與所述待翻譯文本所屬領域對應的領域翻譯模型對所述待翻譯文本進行翻譯,其中所述領域翻譯模型由對應領域的訓練語料訓練得到。?

根據本發明之一優選實施例,所述第一分類模型包括:貝葉斯模型、支持向量機模型、K近鄰分類模型或最大熵模型。?

根據本發明之一優選實施例,所述步驟A進一步包括確定所述待翻譯文本歸屬于所述待翻譯文本所屬領域的概率并判斷該概率是否高于設定的第一閾值,如果是,則所述步驟B中,將與所述待翻譯文本所屬領域對應的領域翻譯模型與通用翻譯模型融合后對所述待翻譯文本進行翻譯,其中所述通用翻譯模型由各領域的訓練語料合并后訓練得到。?

根據本發明之一優選實施例,各領域的訓練語料是采用下列方式得到的:將雙語語料中來自相同頁面的雙語句對歸并為一組從而將所述雙語語料劃分為?多個歸并語料;從各個歸并語料中選擇長度超過設定的第二閾值的歸并語料組成長語料;采用聚類的方法,將相同領域的長語料聚為一類;利用聚類得到的各領域的長語料訓練第二分類模型;使用訓練后的第二分類模型對所述雙語語料中的短語料進行分類,以確定所述短語料所屬領域,并將各領域的短語料與相同領域的長語料進行合并,得到各領域的訓練語料,其中所述短語料為所述雙語語料中除所述長語料之外的其他語料。?

根據本發明之一優選實施例,所述聚類的方法為潛在概率語義分析方法。?

根據本發明之一優選實施例,對所述長語料進行聚類時采用的聚類特征包括:對所述長語料進行分詞后,各個詞語在所述長語料中出現的次數及各互譯詞對在所述長語料中出現的次數。?

根據本發明之一優選實施例,所述第二分類模型包括:貝葉斯模型、支持向量機模型、K近鄰分類模型或最大熵模型。?

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110307878.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91中文字幕一区| 日韩欧美一区精品| 婷婷嫩草国产精品一区二区三区| 国产精品欧美一区乱破| 午夜av在线电影| 久久精品—区二区三区| 国产一区二区免费在线| 亚洲精品久久久久中文字幕欢迎你| 狠狠色综合欧美激情| 一区二区三区欧美视频| 亚洲欧洲日本在线观看| 国产一区2| 欧美精品免费看| 国产精品国产三级国产专区53| 欧美日韩一区二区三区精品| 欧美久久精品一级c片| 97国产精品久久久| 国产一区在线免费| 91精品夜夜| 91亚洲国产在人线播放午夜| 欧美乱妇在线观看| 久久99亚洲精品久久99果| 91精品婷婷国产综合久久竹菊| 日韩欧美激情| 一区二区三区电影在线观看| 91在线一区二区| 九色国产精品入口| 久久久一二区| 国产欧美一区二区三区在线看| 夜夜精品视频一区二区| 国产特级淫片免费看| 欧美精品亚洲一区| 日韩亚洲精品在线| 91精品综合在线观看| 一区精品二区国产| 日韩精品久久一区二区| 精品国产一二三四区| 51区亚洲精品一区二区三区| 国精偷拍一区二区三区| 久久精品入口九色| 国产91精品高清一区二区三区| 国产91丝袜在线| 欧美日韩九区| 91超碰caoporm国产香蕉| 国偷自产一区二区三区在线观看| 精品一区电影国产| 国产欧美www| 国产精品1区二区| 国产精品高潮呻吟88av| 久久精品二| 亚洲精品国产综合| 久久久久久久久久国产精品| 色综合久久网| 国产一区第一页| 少妇又紧又色又爽又刺激视频网站| 91日韩一区二区三区| 午夜毛片在线| 三级视频一区| 精品在线观看一区二区| 午夜影院91| 亚洲精品卡一卡二| 国产高清一区二区在线观看| 日韩不卡毛片| 国产精品视频免费一区二区| 亚洲国产一区二区久久久777| 久久精品综合| 国产高清在线观看一区| 久久精品综合视频| 日韩精品中文字幕在线| 午夜在线看片| 99久热精品| 久爱视频精品| 日韩av在线播| 欧美日韩国产精品一区二区三区| 999久久久国产精品| 狠狠操很很干| 久久综合国产伦精品免费| 欧美激情图片一区二区| 久久99精品国产麻豆宅宅| 久久91精品国产91久久久| 三级视频一区| 欧美精品在线视频观看| 99精品小视频| 亚洲欧美国产日韩综合| 国产91清纯白嫩初高中在线观看| 国产亚洲综合一区二区| 欧美乱妇在线观看| 日韩精品免费一区二区夜夜嗨| 国产偷国产偷亚洲清高| 国产一区二区三级| 国产日韩欧美亚洲综合| 精品一区二区三区中文字幕| 久久天天躁夜夜躁狠狠躁2022| 欧美精品八区| 好吊色欧美一区二区三区视频 | 午夜影院5分钟| 欧美日韩一二三四区| 国产免费一区二区三区四区 | 狠狠躁夜夜av| 少妇高潮大叫喷水| 亚洲国产一区二| 狠狠色噜狠狠狠狠| 日韩精品1区2区3区| 精品一区二区三区中文字幕| 精品一区二区三区视频?| 国产一区二区三区小说| 国产偷窥片| 国产99久久久国产精品免费看| 亚洲欧美日韩一级| 岛国黄色网址| 午夜影院色| 日韩午夜三级| 欧美色图视频一区| 99精品区| 91精品高清| av午夜电影| 色妞www精品视频| 国产精品色婷婷99久久精品| 国产在线一区不卡| 久草精品一区| 日韩中文字幕区一区有砖一区| 午夜精品一区二区三区三上悠亚| 91精品视频一区二区三区| 狠狠插狠狠爱| 久久99亚洲精品久久99果| 国产一区二区三区黄| 国产免费一区二区三区四区五区| 99精品一区二区| 国内久久久| 激情久久久| 国产午夜亚洲精品午夜鲁丝片 | 国产一区影院| 视频一区欧美| 狠狠色狠狠色综合系列| 强制中出し~大桥未久10在线播放| 日韩一区高清| 狠狠色噜噜综合社区| 国产精一区二区三区| xxxx18日本护士高清hd| 午夜剧场a级免费| 国产精品免费自拍| a级片一区| 国产精品一二三区免费| 一区二区在线精品| 午夜精品999| 综合欧美一区二区三区| 男女视频一区二区三区| 国产资源一区二区| 午夜影院一区二区| 福利片午夜| 日韩av电影手机在线观看| 4399午夜理伦免费播放大全| 麻豆91在线| 妖精视频一区二区三区| 最新日韩一区| 国产日产高清欧美一区二区三区| 手机看片国产一区| 国产精品视频二区三区| 国产日韩欧美色图| 亚洲国产精品综合| 国产日韩欧美专区| 国产69精品久久99的直播节目| 亚洲欧美日韩国产综合精品二区 | 小萝莉av| 日本精品一区视频| 日韩夜精品精品免费观看| 免费视频拗女稀缺一区二区| 欧美日韩精品中文字幕| 亚洲精品国产一区二区三区| 欧美一区二区三区中文字幕| 久久久人成影片免费观看| 欧美精品免费看| 精品日韩久久久| 国产精品欧美久久久久一区二区| 91人人爽人人爽人人精88v| 欧美一级免费在线视频| 国产乱人伦精品一区二区| 国产乱子伦农村xxxx| 精品一区二区三区自拍图片区| 欧美精品免费一区二区| 国产午夜亚洲精品羞羞网站| 狠狠色丁香久久综合频道| 国产白丝一区二区三区| 久久精品国产96| 91秒拍国产福利一区| 国产精品视频tv| 亚洲一卡二卡在线| 欧美系列一区| 偷拍久久精品视频| 大bbw大bbw巨大bbb| 99国精视频一区一区一三| 午夜伦情电午夜伦情电影| 91嫩草入口| 亚洲精品91久久久久久| 国产精品麻豆一区二区| 国产69久久| 久久久精品久久日韩一区综合| 欧美乱妇在线观看| 免费91麻豆精品国产自产在线观看| 精品一区二区三区中文字幕| 亚洲国产美女精品久久久久∴| 97人人模人人爽人人喊小说| 一级久久久| 日韩精品一区二区三区免费观看| 97欧美精品| 国产一级大片| 午夜影院一区二区| 国产乱人伦精品一区二区| 国产真实一区二区三区| 国产欧美久久一区二区三区| 国产精品久久久av久久久| 午夜伦情电午夜伦情电影| 高清欧美精品xxxxx在线看| 在线观看欧美一区二区三区| 国产第一区二区三区| 99re久久精品国产| 国产一二区在线观看| 亚洲国产精品麻豆| 精品国产乱码久久久久久免费| 亚洲精品国产suv| 欧美亚洲精品一区二区三区| 91黄色免费看| 亚洲视频精品一区| 日本一区欧美| 国产一区在线视频播放| 久久91久久久久麻豆精品| 欧美极品少妇xx高潮| xxxxhd欧美| 久久91精品国产91久久久| 国产玖玖爱精品视频| 伊人久久婷婷色综合98网| 国产精品视频1区| 国产精品国产三级国产aⅴ下载| 一色桃子av大全在线播放| 国产精品一区在线观看你懂的| 国产偷久久一区精品69| 久久亚洲精品国产一区最新章节| av午夜剧场| 99精品在免费线偷拍| 99精品国产99久久久久久97| 午夜伦情电午夜伦情电影| 国产目拍亚洲精品区一区| 亚洲国产精品一区二区久久hs | 国产高清一区二区在线观看| 国产精品久久久久久久久久久久冷| 精品久久国产视频|