[發明專利]表意構件識別提取和基于表意構件的機譯人校互動翻譯方法有效
| 申請號: | 201310042053.5 | 申請日: | 2013-01-21 |
| 公開(公告)號: | CN103106195B | 公開(公告)日: | 2018-12-11 |
| 發明(設計)人: | 劉樹根 | 申請(專利權)人: | 劉樹根 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 516002 廣東省惠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表意 構件 識別 提取 基于 機譯人校 互動 翻譯 方法 | ||
本發明提供一種表意構件識別提取方法及其機譯人?;邮椒g方法,其中的表意構件識別提取方法為:利用相同內容的多語種或雙語文字版本的語料作句對齊后生成雙語句對庫,以表意將不同語言文字進行關聯,不同語言文字的表意通過四種共同的表意構件實現,識別提取出這四種表意構件包括讀句配骼、識別及標注句艙、艙檢測及提取艙模和收存意群串。本發明還提供了基于表意構件的機譯人?;邮椒g方法,包括讀句配骼、源語句套入、句艙或艙眼內容轉移、存查得項、預選給出目語待校句以及語意校正、自學習。本發明解決了現有技術存在的譯文質量差,要求操作者具獨立翻譯能力,處理過程中無法反悔地丟失詞義、語意之技術問題。
【技術領域】
本發明涉及一種自然語言的處理或轉換的方法;特別涉及一種表意構件識別提取和基于表意構件的機譯人?;臃g方法。
【背景技術】
計算機語言文字的信息處理領域,機器翻譯是技術難度的至高點。
機器翻譯如《自然語言的計算機處理》馮志偉著,上海外語教育出版社1996年10月出版,其中第八章第一節機器翻譯中寫道:“1964年,美國ALPAC報告指出的機器翻譯遇到的‘語義障礙’至今仍然存在,機器翻譯技術至今似乎仍然沒有突破性的進展”。“機器翻譯系統的實用化和商品化問題面臨著嚴峻的考驗”。
大眾軟件,2004年第二期,作者王槊,采訪業界多位專家后報道,《機器翻譯,路在何方》一文中指出MT(machine translation)“機器翻譯技術本身存在的問題是阻礙其發展的硬傷。目前不僅在中國,整個世界范圍內機器翻譯技術都沒有很大的突破。試圖用機器通過有限的規則和語料提高翻譯準確性,在短期內無法實現。在語言智能化研究理論不成熟的情況下,MT軟件研究在技術上碰到瓶頸,無法解決一個單詞在不同語言環境下的詞義選擇問題,同樣也無法在復雜多變的語境中正確選擇語法規則,因此,翻譯水平無法實現明顯提高”。這也是為什么現在的機器翻譯軟件無法滿足人們的需求,翻譯出來的結果往往令人啼笑皆非的原因……。TM(Translation Memory,翻譯記憶),面向專業翻譯人員和機構設計,要求使用者具備獨立的翻譯能力。它的原理是基于數據庫,將翻譯過的所有材料以句子為單位存入數據庫。翻譯時系統自動對電子文檔進行分析,100%匹配的句子可以自動替換,不足100%匹配的句子可根據匹配度提出翻譯建議,新句子完全依靠人工翻譯。最后作者指出:“機器翻譯技術本身存在的問題是阻礙其發展的硬傷。目前不僅在中國,整個世界范圍內機器翻譯技術都沒有很大的突破”。
外語研究,2007年第五期,作者蘇明陽,在《翻譯記憶系統的現狀及其啟示》一文中指出翻譯記憶技術本身的局限,“相同的句子永遠不需要翻譯第二遍”。然而“現實中的翻譯活動大多缺乏重復性,只有在某些特定的領域中,文本的重復才能達到一定的比例”。
湖南醫科大學學報,2010年3月第二期,作者傅彥夫,在《翻譯記憶理論及幾款計算機輔助翻譯軟件評介》一文中回顧并分析了MT經歷了70多年的發展,至今譯文質量確實不能令人欣慰?!半y怪人們把人工智能能列為二十一世紀人類科技十大難題之一。在這種情況下,采用基于翻譯記憶(MT)技術的輔助翻譯系統應運而生”。“翻譯記憶軟件一般都提供翻譯記憶、術語庫管理、翻譯項目管理、語料庫加工與應用等翻譯工具”。語料庫加工是使翻譯過的語料進行句對齊,以雙語或多語語義對齊后的句對建庫,稱“句庫”或“記憶庫”。
CN200910002334.1公開了一種基于實例短語的機器翻譯方法,將基于實例和基于短語結合。雖然翻譯粒度比基于字、詞和基于句更為適中,但僅是利用算法臨時獲得,沒有人腦校正質量難以保證;沒有建庫,不能累積也不能長期使用。
現有技術存在不足,MT①譯文質量差;TM②要求操作者具獨立翻譯能力。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉樹根,未經劉樹根許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310042053.5/2.html,轉載請聲明來源鉆瓜專利網。





