日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]機器翻譯方法及裝置在審

專利信息
申請號: 201611179640.9 申請日: 2016-12-19
公開(公告)號: CN106776586A 公開(公告)日: 2017-05-31
發明(設計)人: 田亮 申請(專利權)人: 新譯信息科技(深圳)有限公司
主分類號: G06F17/28 分類號: G06F17/28
代理公司: 北京同立鈞成知識產權代理有限公司11205 代理人: 楊文娟,劉芳
地址: 518057 廣東省深圳市*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 機器翻譯 方法 裝置
【說明書】:

技術領域

發明涉及通信技術,尤其涉及一種機器翻譯方法及裝置。

背景技術

機器翻譯是利用計算機將一種自然語言翻譯為另一種自然目標語言的過程,用戶在互聯網上的翻譯軟件或翻譯網頁輸入待翻譯的源語言可以得到翻譯后的語言,例如:輸入漢字“中國”,得到英文翻譯“China”。

現有技術中,計算機接收到用戶輸入的待翻譯的內容后,將句子拆分為短語,通過檢索大型雙語平行語料庫中存儲的短語的翻譯結果,得到短語的翻譯結果,將短語的翻譯結果組合排序后得到翻譯的結果。

采用現有技術,機器翻譯結果依賴雙語平行語料庫的質量和規模,機器翻譯的效率不高。

發明內容

本發明提供一種機器翻譯方法及裝置,提高了機器翻譯的效率。

本發明提供一種機器翻譯方法,包括:

從第一語句中獲取第一短語集合,所述第一短語集合包括所述第一語句中連續的n元短語;

從第一語料庫中獲取第二短語集合,所述第二短語集合包括所述第一語料庫中的所有n元短語,所述第一語料庫為可比較語料庫;

通過自動對齊算法從第二短語集合中獲取第三短語集合,所述第三短語集合中的短語對所述第一短語集合中的短語的第一翻譯關系包括:一對一、一對多和/或多對多;

通過所述第一翻譯關系從所述第三短語集合中獲取第二語句,所述第二語句為所述第一語句的翻譯結果。

在本發明一實施例中,所述第一語料庫包括:所述第一語句所使用的語言和所述第二語句所使用的語言互譯的網頁內容。

在本發明一實施例中,所述自動對齊算法包括:

根據所述第一短語的長度信息和所述第三短語的長度信息得到歸一化長度值,所述第一短語為所述第一短語集合中的短語,所述第三短語為所述第三短語集合中的短語;

利用高斯方程或泊松分布公式、所述歸一化長度值和所述第一短語和所述第三短語的對齊類型,對所述第一短語和所述第三短語集合中的短語進行對齊,所述對齊類型包括:一個短語對一個短語對齊、一個短語對多個短語對齊和多個短語對多個短語對齊;

根據IBM模型通過最大期望EM算法過濾所述第三短語集合中的短語;

根據所述第一短語和所述第三短語的詞相似性得到所述第三短語集合。

在本發明一實施例中,所述自動對齊算法包括:

根據得到所述歸一化長度,其中,所述ls為所述第一短語的長度,所述lt為所述第三短語的長度,所述r為所述第一語句所使用的語言和所述第二語句所使用的語言長度的比率,所述σ2是所述第一語句所使用的語言和所述第二語句所使用的語言的樣本方差;

根據或對所述第一短語和所述第三短語集合中的短語進行對齊,以得到所述第一短語與所述第三短語對齊的概率p(δ(ls,lt)|type)=p(|X|≥|δ(ls,lt)|)=2(1-p(X<|δ(ls,lt)|)),其中,所述μ是是所述第一語句所使用的語言和所述第二語句所使用的語言的樣本期望,所述α是常量,所述type為所述第一語句所使用的語言和所述第二語句所使用的語言的對齊類型;

根據模型,通過EM算法過濾所述第三短語集合中的短語,其中,所述s所述第一語句所使用的語言,t為所述第二語句所使用的語言,所述l為所述第一語句中包括的所述第一短語的個數,所述m為所述第三短語的個數,所述ε為常量;

根據得到所述第三短語集合,其中,(l-gram)∩(m-gram)是所述第一短語和所述第三短語中相同字符的個數,所述(l-gram)是所述第一短語的長度,所述(m-gram)是所述第三短語的長度。

在本發明一實施例中,所述通過所述第一翻譯關系從所述第三短語集合中得到第二語句,包括:

根據tbest=arg maxtp(tn-best)得到第二語句,其中,所述tn-best為所述第三短語集合中的短語組合。

本發明提供一種機器翻譯裝置,包括:

獲取模塊,所述獲取模塊用于從第一語句中獲取第一短語集合,所述第一短語集合包括所述第一語句中連續的n元短語;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新譯信息科技(深圳)有限公司,未經新譯信息科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611179640.9/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 在线观看国产91| 午夜精品999| 88888888国产一区二区| 精品日韩久久久| 国产日韩欧美网站| 亚洲精品国产精品国自产网站按摩| 99久久精品国产国产毛片小说 | 久久er精品视频| 国产精品白浆一区二区| 国产69精品久久久久999小说| 少妇高清精品毛片在线视频| 精品久久不卡| 国产日韩欧美三级| 国产综合亚洲精品| 精品videossexfreeohdbbw| 久久精品爱爱视频| 国产精品麻豆自拍| 精品久久久久一区二区| 91丝袜国产在线播放| 国产欧美日韩在线观看 | 久久天堂国产香蕉三区| 蜜臀久久99静品久久久久久 | 欧美精品在线不卡| 中文乱码在线视频| 午夜毛片在线观看| 久久99精品久久久久婷婷暖91| 一区精品二区国产| 销魂美女一区二区| 娇妻被又大又粗又长又硬好爽| 一区二区三区国产精品视频 | 国产视频精品一区二区三区| 好吊妞国产欧美日韩免费观看网站| 免费午夜在线视频| 一区二区三区四区视频在线| 国产精品对白刺激在线观看 | 国产精品自产拍在线观看蜜| 久久一区二| 欧美日韩国产区| 国产v亚洲v日韩v欧美v片| 国产精品不卡一区二区三区| 国产日韩欧美亚洲综合| 国产91福利视频| 欧美精品日韩一区| 黑人巨大精品欧美黑寡妇| 国产99视频精品免费视频7| 欧美hdfree性xxxx| 91精品资源| 欧美精品五区| 年轻bbwwbbww高潮| 91丝袜诱惑| 一色桃子av| 国产高清在线精品一区二区三区| 欧美日韩中文字幕三区| 国产乱人乱精一区二视频国产精品 | 91麻豆精品国产91久久久更新资源速度超快| 91狠狠操| 欧美在线视频二区| 国产日韩欧美另类| 色乱码一区二区三在线看| 福利片91| 日韩一区免费| 精品无人国产偷自产在线| 美女张开腿黄网站免费| 欧美极品少妇videossex| 久久久精品视频在线| 国产精品一卡二卡在线观看| 国产韩国精品一区二区三区| 性精品18videosex欧美| 日韩一区二区精品| 欧美视频1区| 国产丝袜一区二区三区免费视频| 99久久久国产精品免费调教网站| 久久久久久中文字幕| 婷婷午夜影院| 欧美在线观看视频一区二区 | 农村妇女毛片精品久久| 国内久久久| 亚洲欧洲一区| 秋霞三级伦理| 日韩精品乱码久久久久久| 国产日韩区| 国产精品偷拍|