[發明專利]用于形成機器翻譯的語義單元及其表示庫的方法及其系統無效
| 申請號: | 200710197070.0 | 申請日: | 2007-12-06 |
| 公開(公告)號: | CN101452447A | 公開(公告)日: | 2009-06-10 |
| 發明(設計)人: | 胡玥;高小宇;高慶獅 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 李 崢 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 形成 機器翻譯 語義 單元 及其 表示 方法 系統 | ||
技術領域
本發明涉及機器翻譯,更具體的,涉及基于語義的機器翻譯的語義單元及其表示庫的形成方法和系統。
背景技術
隨著世界交流的劇增,利用計算機技術在不同自然語言之間進行自動翻譯成為非常重要的問題。但是由于自然語言的多樣性及多語種之間存在復雜的對應關系,現有的機器翻譯的準確率較低、通順度較差,經常存在語無倫次、正錯混雜的情況,使數以萬計人工翻譯公司無法使用。
而機器翻譯中的語義單元及其表示庫的質量直接關系到機器翻譯的譯文的質量。現有的方法提取出的語義單元及其表示庫存在不必要的臃腫及歧義的語義單元及其表示的問題,致使機器翻譯的譯文也出現語無倫次的質量問題。
發明內容
針對現有技術存在的問題,本發明提供了一種用于形成基于語義語言的自然語言機器翻譯的語義單元及其表示庫的方法和系統。
根據本發明的一個方面,提供了一種形成用于基于語義語言的自然語言機器翻譯的語義單元及其表示庫的方法,包括:提取指定受限領域的語義單元及其雙語或者多語語義單元及其表示;創建所述指定受限領域的語義單元及其表示子庫;以及將所述多個指定受限領域的語義單元及其表示子庫合并到原來的語義單元及其表示庫,從而形成新的無重復、無可棄、無非正常歧義的語義單元及其表示庫。
根據本發明的另一方面,提供了一種用于形成基于語義語言的自然語言機器翻譯的語義單元及其表示庫的系統,包括:用于提取指定受限領域的語義單元及其雙語或者多語語義單元及其表示的裝置;用于創建所述指定受限領域的語義單元及其表示子庫的裝置;以及用于將所述多個指定受限領域的語義單元及其表示子庫合并到原來的語義單元及其表示庫,以形成新的語義單元及其表示庫的裝置。
附圖說明
通過參考附圖對本方面的實施例進行詳細描述,本發明的優點和特點將顯而易見,其中:
圖1為根據本發明的實施例的用于形成基于語義的機器翻譯的語義單元及其表示庫的方法的流程圖;
圖2A和2B為根據本發明的實施例的指定受限領域的語義單元及其表示庫中記載語義單元及其表示的數據表的示例,其中圖2A為提取的經過加注處理的語義單元及其表示庫中記載語義單元及其表示的示例,而圖2B為還經過去可棄化和去重復處理的記載語義單元及其表示的示例;
圖3為根據本發明的實施例的形成新的語義單元及其表示庫的步驟的流程圖;以及
圖4為根據本發明的實施例的用于形成基于語義的機器翻譯的語義單元及其表示庫的系統的示意圖。
具體實施方式
下面結合附圖,來對本發明的實施例進行詳細描述。
為了清楚的描述本發明的概念,首先對本發明涉及的術語和概念進行解釋:
語義單元:在自然語言中,表達一個意思的單元稱為語義單元,如“工程師”。
語義單元及其表示:在任何一種具體的自然語言中的表達一個意思的單元(語義單元)稱為該語義單元在該具體自然語言中的語義單元及其表示。例如工程師的漢語表示為“工程師”,英語表示為“engineer”。
句義:具體的自然語言的一個句子的意義,稱為句義。例如“我是學生”。句義由語義單元組成,例如,“我是學生”由“我”、“學生”、“是職稱(<N[人]>,<N[職稱]>)”這幾個語義單元組成。而<N[人]>、<N[職稱]>分別是有關人的名詞和有關職稱的名詞,它們是兩個參數,需要被替換為與該參數類型相同的語義單元。
句義表達式:句義可以用將參數全部替換的復合語義單元來表達,即是職稱(<我>,<學生>),其中<我>,<學生>分別是語義單元及其表示“我”和“學生”對應的語義單元。
語義語言由全部的語義單元組成,一個具體的自然語言可以看作語義語言的一個表示。
可棄語義單元:可以由其它語義單元通過代入形成的語義單元,例如上面的是職稱(<我>,<學生>)。與其相對的非可棄語義單元為基本語義單元。
歧義:指不同語義單元在某個自然語言上具有相同的語義單元及其表示。歧義包括真歧義和非正常歧義,非正常歧義指本來不是真歧義,而是加上場所、領域、情景或者類型標注后就變為非歧義。因此,對于非正常歧義必須加上領域標注以使其為非歧義。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710197070.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:動作時間穩定的壓縮機保護器
- 下一篇:顯示器亮度調節方法及裝置以及計算機





