[發(fā)明專利]一種機器翻譯方法及系統(tǒng)無效
| 申請?zhí)枺?/td> | 200910105966.0 | 申請日: | 2009-03-11 |
| 公開(公告)號: | CN101593174A | 公開(公告)日: | 2009-12-02 |
| 發(fā)明(設(shè)計)人: | 林勛準(zhǔn) | 申請(專利權(quán))人: | 林勛準(zhǔn) |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 深圳鼎合誠知識產(chǎn)權(quán)代理有限公司 | 代理人: | 宋鷹武 |
| 地址: | 518027廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機器翻譯 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種機器翻譯方法及系統(tǒng)。
背景技術(shù)
語言是人類相互交流中使用最廣泛的工具,然而,不同民族、不同國家之間常常使用著不同的語言,這阻礙了人們直接進(jìn)行意思交換,而需要借助于翻譯來達(dá)成不同語言之間的相互意思傳遞。隨著世界各國人民之間的交流的日益頻繁,單純依靠人力翻譯顯然無法滿足人們相互交流的需要,機器翻譯應(yīng)運而生。
機器翻譯一直被認(rèn)為是突破語言障礙的主要途徑,然而,現(xiàn)今的機器翻譯尚無法成為一種可信的信息交流工具。在相當(dāng)多的情況下,機器翻譯系統(tǒng)的譯文不知所云,令人無法得知對方真實表達(dá)的意思。機器翻譯的質(zhì)量亟待提高。
發(fā)明內(nèi)容
有鑒于上述背景,本發(fā)明的目的是提供一種機器翻譯方法和系統(tǒng),能夠得到高質(zhì)量的譯文,從而使機器翻譯真正成為一種可信的語言交流工具。
為了解決上述技術(shù)問題,本發(fā)明采用了如下技術(shù)方案:
一種機器翻譯方法,包括:
獲取待翻譯的第一語種的語句;
識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;
翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;
按照所述第二語種的語言表達(dá)方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。
所述的方法,還包括:識別所述第一語種的語句中是否包含連接詞,以及翻譯該連接詞為第二語種的連接詞。
所述的方法,識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是:識別所述語句的主語詞組、謂語詞組和賓語詞組是否標(biāo)記有詞組標(biāo)記符。
所述的方法,還包括:識別所述第一語種的語句的主語詞組是否包括主語修飾語,識別所述第一語種的語句的謂語詞組是否包括謂語修飾語,識別所述第一語種的語句的賓語詞組是否包括賓語修飾語。
所述的方法,識別所述主語修飾語、謂語修飾語或賓語修飾語的方式是:識別主語詞組、謂語詞組或賓語詞組中是否標(biāo)記有修飾語標(biāo)記符。
所述的方法,還包括:識別所述第一語種的語句是否包含問句。
所述的方法,識別所述第一語種的語句是否包含問句的方式是:識別主語詞組、謂語詞組或賓語詞組后面是否有提問標(biāo)記符。
所述的方法,識別后的所述第一語種的語句按如下格式順序排列:主語、主語的提問標(biāo)識符、主語修飾語、謂語、謂語的提問標(biāo)記符、謂語修飾語、賓語、賓語的提問標(biāo)識符、賓語修飾語;當(dāng)所述主語、主語的提問標(biāo)識符、主語修飾語、謂語、謂語的提問標(biāo)記符、謂語修飾語、賓語、賓語的提問標(biāo)識符、賓語修飾語中的一種或多種缺失時,在排列時相應(yīng)置空。
所述的方法,所述主語修飾語、謂語修飾語、賓語修飾語在排列時,分別位于一括號內(nèi)。
所述的方法,在獲取待翻譯的第一語種的語句之前,還可以包括:
接收從輸入接口輸入的第一語種的自然語句;
識別第一語種的每一個自然語句是否包含主語詞組、謂語詞組和賓語詞組,如果不是,則將該語句補充成包括主語詞組、謂語詞組和賓語詞組的完整結(jié)構(gòu),形成為待翻譯的第一語種的語句。
也可以包括下述標(biāo)記過程的一種或多種:
為第一語種的主語詞組、謂語詞組和賓語詞組標(biāo)記上詞組標(biāo)記符;
為第一語種的主語詞組中的主語修飾語、謂語詞組中的謂語修飾語之間、賓語詞組中的賓語修飾語標(biāo)記上修飾語標(biāo)記符;
對包含問句的第一語種的語句,為被提問的主語詞組、謂語詞組或賓語詞組標(biāo)記上提問標(biāo)記符。
本發(fā)明還公開了一種機器翻譯系統(tǒng),包括:
獲取單元,用于獲取待翻譯的第一語種的語句;
識別單元,用于識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組;
翻譯單元,用于翻譯所述第一語種的語句的主語詞組、謂語詞組和賓語詞組為第二語種的主語詞組、謂語詞組和賓語詞組;
成形單元,用于按照所述第二語種的語言表達(dá)方式排布所述第二語種的主語詞組、謂語詞組和賓語詞組,形成為第二語種的語句。
所述的系統(tǒng),所述識別單元還用于識別所述第一語種的語句中的連接詞,所述翻譯單元還用于翻譯所述第一語種的語句中的連接詞。
所述的系統(tǒng),識別單元識別所述第一語種的語句的主語詞組、謂語詞組和賓語詞組的方式是:識別所述語句的主語詞組、謂語詞組和賓語詞組是否標(biāo)記有詞組標(biāo)記符。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于林勛準(zhǔn),未經(jīng)林勛準(zhǔn)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910105966.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





