[發(fā)明專利]使用統(tǒng)計(jì)流數(shù)據(jù)進(jìn)行不同語言之間的機(jī)器翻譯有效
| 申請(qǐng)?zhí)枺?/td> | 201580071517.2 | 申請(qǐng)日: | 2015-12-02 |
| 公開(公告)號(hào): | CN107111614B | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 哈桑·薩瓦夫 | 申請(qǐng)(專利權(quán))人: | 貝寶公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/51 |
| 代理公司: | 北京東方億思知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 陳蒙 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 統(tǒng)計(jì) 數(shù)據(jù) 進(jìn)行 不同 語言 之間 機(jī)器翻譯 | ||
在計(jì)算機(jī)動(dòng)作的流中,計(jì)算機(jī)系統(tǒng)(110)接收涉及機(jī)器翻譯的請(qǐng)求。在執(zhí)行翻譯(160,238)中或在后續(xù)的計(jì)算機(jī)操作(242,1110)中使用翻譯時(shí),計(jì)算機(jī)系統(tǒng)考慮從先前累積的點(diǎn)擊數(shù)據(jù)(180)獲得的在流中執(zhí)行的機(jī)器翻譯、流在翻譯之前的部分、以及與流在翻譯之后的部分有關(guān)的成功指示符之間的已知統(tǒng)計(jì)關(guān)系(310)。統(tǒng)計(jì)關(guān)系是通過對(duì)點(diǎn)擊數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘得到的。此外,可以暫停正常動(dòng)作以使用隨機(jī)選項(xiàng)來累積點(diǎn)擊數(shù)據(jù)和/或執(zhí)行統(tǒng)計(jì)AB測試。還提供了其他特征。
本申請(qǐng)是2014年12月29日提交的美國專利申請(qǐng)No.14/584,925的繼續(xù)申請(qǐng)并且要求其優(yōu)先權(quán),該專利申請(qǐng)的全部內(nèi)容通過引用并入本文。
本發(fā)明涉及在需要不同語言之間的翻譯時(shí)在計(jì)算機(jī)網(wǎng)絡(luò)中使用統(tǒng)計(jì)數(shù)據(jù)進(jìn)行機(jī)器翻譯。
隨著互聯(lián)網(wǎng)和其他計(jì)算機(jī)網(wǎng)絡(luò)跨越國際邊界并提供對(duì)用不同語言編寫的各種文件的訪問,翻譯正變得越來越重要。商業(yè)、科學(xué)、工程、政治、藝術(shù)和其他類型的人類交互通常需要翻譯。人類翻譯員無法跟上這一需求,并且機(jī)器翻譯正變得普遍。機(jī)器翻譯(MT)隨著計(jì)算機(jī)執(zhí)行計(jì)算機(jī)指令而由計(jì)算機(jī)產(chǎn)生。從某種意義上講,MT系統(tǒng)應(yīng)該模仿人類翻譯員的工作,人類翻譯員理解源語言并在目標(biāo)語言中表達(dá)相同的理解。然而,人類的理解和人類的表達(dá)不能被計(jì)算機(jī)所捕獲:人類和計(jì)算機(jī)都可以參考詞典和語法規(guī)則,人類甚至可以在不了解語法的情況下進(jìn)行翻譯,并且人類在即使不說的情況下理解彼此的能力以計(jì)算機(jī)無與倫比的方式提高他們的翻譯能力,計(jì)算機(jī)不了解任何東西而僅遵循指令。另一方面,計(jì)算機(jī)速度是人類無與倫比的,并且計(jì)算機(jī)存儲(chǔ)大量數(shù)據(jù)的能力也是人類無與倫比的,這些大量的數(shù)據(jù)無需提示或線索即可系統(tǒng)地調(diào)用。因此,機(jī)器翻譯已經(jīng)開發(fā)為具有自己的詞匯和統(tǒng)計(jì)技術(shù)的領(lǐng)域,旨在滿足通常的工程問題,例如最小化計(jì)算機(jī)資源(存儲(chǔ)器、處理能力、網(wǎng)絡(luò)帶寬等)的使用,同時(shí)提供足夠的速度和低成本。
圖1示出了具有服務(wù)器110的計(jì)算機(jī)網(wǎng)絡(luò),服務(wù)器110響應(yīng)于通過網(wǎng)絡(luò)130(例如,因特網(wǎng))從計(jì)算機(jī)120接收到的請(qǐng)求來執(zhí)行機(jī)器翻譯。服務(wù)器110可以是單個(gè)計(jì)算機(jī)或是分布式系統(tǒng),該分布式系統(tǒng)包括由可能包括網(wǎng)絡(luò)130的各種網(wǎng)絡(luò)互連的多個(gè)計(jì)算機(jī)。來自計(jì)算機(jī)120的請(qǐng)求可以是翻譯文檔的顯式請(qǐng)求,或者可以是執(zhí)行需要翻譯的某些其他任務(wù)(例如以不同語言執(zhí)行對(duì)文檔的搜索)的請(qǐng)求。因此,計(jì)算機(jī)120的用戶可以以一種語言提交搜索查詢,但是該查詢必須與用另一種語言編寫的文檔進(jìn)行匹配,因此在搜索可以繼續(xù)之前必須翻譯搜索查詢。
服務(wù)器110可以訪問存儲(chǔ)要搜索的文檔的計(jì)算機(jī)數(shù)據(jù)庫140。如果需要,機(jī)器翻譯引擎160翻譯查詢。搜索引擎150接受經(jīng)翻譯的查詢,搜索相關(guān)數(shù)據(jù)庫140,并產(chǎn)生搜索結(jié)果,例如,具有針對(duì)每個(gè)文檔的鏈接(URL)的數(shù)據(jù)庫文檔的列表,可能具有每個(gè)文檔的簡要描述或文檔內(nèi)容的示例。
MT引擎160使用其數(shù)據(jù)庫170來執(zhí)行翻譯。數(shù)據(jù)庫170包含語言模型信息170R(其包括計(jì)算機(jī)詞典和語法的計(jì)算機(jī)表示),并且還包含從已知翻譯得到的統(tǒng)計(jì)信息170S。
重要的是,服務(wù)器可以存儲(chǔ)關(guān)于搜索請(qǐng)求的信息,以幫助改進(jìn)未來的翻譯。這些信息顯示為點(diǎn)擊日志180。例如,假設(shè)許多用戶提交了我們將表示為“qEn”的英文查詢,并且在獲得搜索結(jié)果之后,用戶經(jīng)常從搜索結(jié)果中選擇給定的URL(統(tǒng)一資源定位符),例如www.fedex.com,這其是美國公司的英文主頁。假設(shè)許多其他用戶(可能是講中文的人)也提交中文查詢qCn,獲得搜索結(jié)果,并選擇URL www.fedex.com/cn,其是同一公司的中文主頁的網(wǎng)址。服務(wù)器110可以得出結(jié)論,英文查詢qEn是中文查詢qCn的英文翻譯。針對(duì)點(diǎn)擊數(shù)據(jù)用于改進(jìn)機(jī)器翻譯的其他用途,參見例如于2010年6月24日發(fā)布的美國授予專利前公布號(hào)2010/0161642(Chen等人)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貝寶公司,未經(jīng)貝寶公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580071517.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一體化電機(jī)控制器
- 下一篇:煙感探測器
- 統(tǒng)計(jì)系統(tǒng)、統(tǒng)計(jì)裝置和統(tǒng)計(jì)方法
- 人數(shù)統(tǒng)計(jì)方法和人數(shù)統(tǒng)計(jì)系統(tǒng)
- 統(tǒng)計(jì)物體數(shù)量的統(tǒng)計(jì)系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計(jì)計(jì)數(shù)方法
- 統(tǒng)計(jì)信息上報(bào)方法及裝置
- 稿件統(tǒng)計(jì)方法和稿件統(tǒng)計(jì)系統(tǒng)
- 數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計(jì)狀態(tài)的方法及裝置
- 信息統(tǒng)計(jì)方法和信息統(tǒng)計(jì)裝置
- 電量統(tǒng)計(jì)系統(tǒng)及電量統(tǒng)計(jì)方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 請(qǐng)求沒有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法





