[發明專利]機器翻譯方法和系統無效
| 申請號: | 200910247943.3 | 申請日: | 2009-12-31 |
| 公開(公告)號: | CN101739395A | 公開(公告)日: | 2010-06-16 |
| 發明(設計)人: | 程光遠 | 申請(專利權)人: | 程光遠 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陳亮 |
| 地址: | 200060 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器翻譯 方法 系統 | ||
1.一種把非形式化的源語言翻譯成形式化的目標語言的機器翻譯方法,該方法包括:
步驟一:對非形式化的源語言進行形式化處理——對于非形式化的源語言的初始語段,首先,逐個切分固定語段并標注固定語段的意義標記,直到最后一個固定語段,然后,逐層組合非固定語段并標注非固定語段的核心成分標記、關系標記,直到整個初始語段構成的一個非固定語段;
步驟二:以自動方式把形式化的源語言轉換成形式化的目標語言——以自動方式運用固定語段轉換規則把源語言的固定語段轉換成目標語言的語段。
2.根據權利要求1所述的機器翻譯方法,其特征在于:在步驟一中,使用替代標記進行預處理——預先使用替代標記把一個初始語段分解成若干個子語段,接著對這些子語段分別進行形式化處理。
3.根據權利要求1所述的機器翻譯方法,其特征在于:步驟一是以交互方式對非形式化的源語言進行形式化處理——對于非形式化的源語言的初始語段,首先,以交互方式逐個切分固定語段并標注固定語段的意義標記,直到最后一個固定語段,然后,以交互方式逐層組合非固定語段并標注非固定語段的核心成分標記、關系標記,直到整個初始語段構成的一個非固定語段。
4.根據權利要求3所述的機器翻譯方法,其特征在于:以交互方式切分并標注固定語段的過程進一步包括:存儲器里的固定語段模式包含固定語段及其意義標記,其中形式相同意義不同的固定語段帶有意義標記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果在存儲器里存在最前的n,個文字單元開頭的固定語段而不存在最前的n+1個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數,運用一個固定語段模式標注這個固定語段的意義標記,然后,使用者確認或修改,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,使用者就切分剩余語段的最前的1個文字單元開頭的固定語段并標注這個固定語段的意義標記,然后,處理器切分和標注下一個固定語段。
5.根據權利要求1所述的機器翻譯方法,其特征在于:步驟一是以自動方式對非形式化的源語言進行形式化處理——對于非形式化的源語言的初始語段,首先,以自動方式逐個切分固定語段并標注固定語段的意義標記,直到最后一個固定語段,然后,以自動方式逐層組合非固定語段并標注非固定語段的核心成分標記、關系標記,直到整個初始語段構成的一個非固定語段。
6.根據權利要求5所述的機器翻譯方法,其特征在于:以自動方式切分并標注固定語段的過程進一步包括:存儲器里的固定語段模式包含固定語段及其意義標記、語法屬性標記、語義屬性標記,其中形式相同意義不同的固定語段帶有意義標記;處理器依次判斷,在存儲器里,是否存在最前的1個文字單元開頭的固定語段,是否存在最前的2個文字單元開頭的固定語段,是否存在最前的3個文字單元開頭的固定語段,依此類推;如果,在存儲器里,存在最前的n個文字單元開頭的固定語段而不存在最前的n+1個文字單元開頭的固定語段,處理器就把最前的n個文字單元切分為固定語段,其中n是自然數,查出存儲器里的各個可以運用的固定語段模式,按累計運用次數從多到少的選擇順序選擇其中的一個固定語段模式,運用這個固定語段模式標注這個固定語段的意義標記、語法屬性標記、語義屬性標記,依此類推,直到最后一個固定語段;如果處理器查出在存儲器里不存在剩余語段的最前的1個文字單元開頭的固定語段,處理器就進行回溯。
7.根據權利要求5所述的機器翻譯方法,其特征在于:以自動方式組合并標注非固定語段的過程進一步包括:存儲器里的非固定語段模式包含成分語段的語法屬性標記、語義屬性標記和組合語段的組合標記、核心成分標記、關系標記、語法屬性標記、語義屬性標記;處理器查出存儲器里的各個可以運用的非固定語段模式,按累計運用次數從多到少的選擇順序選擇其中的一個非固定語段模式,運用這個非固定語段模式組合一個非固定語段并標注這個非固定語段的核心成分標記、關系標記、語法屬性標記、語義屬性標記,然后,處理器組合和標注下一個非固定語段,依此類推,直到整個初始語段構成的一個非固定語段;如果處理器查出在存儲器里不存在可以運用的非固定語段模式,處理器就進行回溯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于程光遠,未經程光遠許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910247943.3/1.html,轉載請聲明來源鉆瓜專利網。





