[發明專利]新詞譯文的挖掘方法和裝置有效
| 申請號: | 201410218936.1 | 申請日: | 2014-05-22 |
| 公開(公告)號: | CN103970732B | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 劉占一;劉紅雨;吳華;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/28;G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 路凱,胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新詞 譯文 挖掘 方法 裝置 | ||
技術領域
本發明實施例涉及機器翻譯技術領域,尤其涉及一種新詞譯文的挖掘方法和裝置。
背景技術
語言會隨著時間的推移而不斷的進化。世界上的每一種語言都會經歷不斷演化的過程。而且,這種演化不僅表現在人們日常的口頭用語的演化,還表現在人們書面用語的演化。在這方面,新詞的不斷出現就是一個很好的例證。所謂新詞,具體是在另一語種中無對應譯文、或者其含義已經變更而原有譯文不準確的詞匯。
在機器翻譯的實踐中,獲取新詞的譯文往往是技術上的一個難點。因為新詞才剛剛出現,所以在現有的譯文數據庫或者工具書中很難找到它對應的譯文。互聯網是現今大家溝通交流的不可或缺的重要方式。由于互聯網已經為普通人所了解和使用,所以人們在生活中使用的新詞、熱詞也會出現在互聯網上。所以,從互聯網上獲取新詞的譯文不失為一種好的獲取新詞譯文的方式。
但是,現有的從互聯網上獲取新詞譯文的方式對原文的處理較為粗糙,造成獲得的結果譯文的準確率不高。
發明內容
有鑒于此,本發明實施例提出一種新詞譯文的挖掘方法和裝置,以提高從互聯網上獲得的新詞譯文的準確性。
第一方面,本發明實施例提供了一種新詞譯文的挖掘方法,所述方法包括:
將包含新詞的源語言語句,通過語義分析和翻譯,構造目標語言檢索語句;
利用所述目標語言檢索語句在目標語言數據源中進行檢索,獲取目標語言語句;
通過將所述目標語言語句與所述源語言語句進行語義匹配,獲取所述新詞的目標語言譯文。
第二方面,本發明實施例提供了一種新詞譯文的挖掘裝置,所述裝置包括:
檢索語句構造模塊,用于將包含新詞的源語言語句,通過語義分析和翻譯,構造目標語言檢索語句;
數據源搜索模塊,用于利用所述目標語言檢索語句在目標語言數據源中進行檢索,獲取目標語言語句;
譯文獲取模塊,用于通過將所述目標語言語句與所述源語言語句進行語義匹配,獲取所述新詞的目標語言譯文。
本發明實施例提供的新詞譯文的挖掘方法和裝置將包含新詞的源語言語句,通過語義分析和翻譯,構造目標語言檢索語句,然后利用所述目標語言檢索語句在目標語言數據源中進行檢索,獲取目標語言語句,最后通過將所述目標語言語句與所述源語言語句進行語義匹配,獲取所述新詞的目標語言譯文,由于源語言語句和目標語言語句反復進行了語義分析和匹配,并且使用語句進行目標語言語句的搜索,提高了獲取的新詞譯文的準確率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發明的其它特征、目的和優點將會變得更明顯:
圖1是本發明第一實施例提供的新詞譯文的挖掘方法的流程圖;
圖2是本發明第一實施例提供的新詞譯文的挖掘方法的處理實例流程圖;
圖3是本發明第二實施例提供的新詞譯文的挖掘方法中檢索語句構造的流程圖;
圖4是本發明第二實施例提供的檢索語句構造過程中的語句構造的流程圖;
圖5是本發明第二實施例提供的新詞譯文挖掘方法中檢索語句構造的處理實例流程圖;
圖6是本發明第三實施例提供的新詞譯文的挖掘方法中數據源搜索的流程圖;
圖7是本發明第三實施例提供的新詞譯文的挖掘方法中數據源搜索的處理實例流程圖;
圖8是本發明第四實施例提供的新詞譯文的挖掘方法中譯文獲取的流程圖;
圖9是本發明第四實施例提供的新詞譯文的挖掘方法中譯文獲取的處理實例流程圖;
圖10是本發明第五實施例提供的新詞譯文的挖掘裝置的結構圖。
具體實施方式
下面結合附圖和實施例對本發明作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅用于解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部內容。
圖1及圖2示出了本發明的第一實施例。
圖1是本發明第一實施例提供的新詞譯文的挖掘方法的流程圖。本實施例的方法可以由新詞譯文的挖掘裝置來實現,該裝置通常可配置在諸如機器翻譯服務器等計算裝置中,并且上述機器翻譯服務器優選是與互聯網連接,具有網絡檢索功能。參見圖1,所述新詞譯文的挖掘方法包括:
S110,將包含新詞的源語言語句,通過語義分析和翻譯,構造目標語言檢索語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410218936.1/2.html,轉載請聲明來源鉆瓜專利網。





