[發明專利]信息處理方法和裝置有效
| 申請號: | 201310325244.2 | 申請日: | 2013-07-30 |
| 公開(公告)號: | CN104346325B | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 鄭仲光;孟遙;于浩 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 李春暉,李德山 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 方法 裝置 | ||
技術領域
本申請涉及自然語言處理領域,尤其涉及機器翻譯中的信息處理方法和裝置。
背景技術
統計機器翻譯是把一種語言通過一些自動學習出來的翻譯規則和一定算法轉換成另一種語言的自然語言處理技術。
但是,在一些特定的領域例如科技文獻領域,由于往往會出現較多的多詞單元,且這些多詞單元并不存在匹配的翻譯規則,此時對于這些多詞單元的翻譯通常采用逐詞翻譯的方式,導致翻譯錯誤,影響譯文的可讀性。
發明內容
本申請的實施方式提供了一種信息處理方法和裝置,能夠利用最相似多詞單元對沒有匹配的翻譯規則的多詞單元進行處理,提高譯文的可讀性。
本申請實施方式提供一種信息處理方法,包括:識別信息中的多詞單元;從翻譯規則數據庫中查找所述多詞單元的最相似多詞單元及關聯詞串所分別匹配的翻譯規則,所述關聯詞串包括所述多詞單元的所有子串及與所述多詞單元部分重疊的多詞單元;根據每一翻譯規則與所述最相似多詞單元所匹配的翻譯規則的關系確定每一翻譯規則的得分;根據得分滿足預設條件的翻譯規則確定所述多詞單元的翻譯結果。
本申請的另一實施方式中提供一種信息處理裝置,包括:多詞單元識別模塊,配置成識別信息中的多詞單元;翻譯規則查找模塊,配置成從翻譯規則數據庫中查找所述多詞單元的最相似多詞單元及關聯詞串所分別匹配的翻譯規則,所述關聯詞串包括所述多詞單元的所有子串及與所述多詞單元部分重疊的多詞單元;得分確定模塊,配置成根據每一翻譯規則與所述最相似多詞單元所匹配的翻譯規則的關系確定每一翻譯規則的得分;以及翻譯結果確定模塊,配置成根據得分滿足預設條件的翻譯規則確定所述多詞單元的翻譯結果。
本申請中,根據最相似多詞單元的翻譯規則確定沒有匹配翻譯規則的多詞單元的翻譯方法,對最相似多詞單元的翻譯規則的參考提高了譯文的可讀性。
附圖說明
參照下面結合附圖對本申請實施方式的說明,會更加容易地理解本申請的以上和其它目的、特點和優點。附圖以示例而非限制性的方式來說明本申請。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。
圖1至圖3示出機器翻譯系統的平行語料;
圖4示出利用標注器對信息進行標注的示意圖;
圖5示出多詞單元的翻譯方法的實施方式一的流程示意圖;
圖6示出多詞單元的翻譯方法的實施方式二的流程示意圖;
圖7示出本申請提供的信息處理方法的應用示例的流程圖;
圖8示出圖7所示的應用示例中信息的翻譯結果;
圖9示出本申請實施方式提供的信息處理裝置的結構示意圖;以及
圖10示出本申請實施方式提供的計算設備的結構示意圖。
具體實施方式
現在參考附圖來更加詳細地描述本申請的實施方式。示例實施方式的提供是為了使本申請更加詳盡,并且向本領域技術人員充分地傳達保護范圍。闡述了眾多的特定細節如特定部件、裝置的例子,以提供對本申請的實施方式的詳盡理解。對于本領域技術人員而言將會明顯的是,示例實施方式可以用許多不同的形式來實施而不一定使用這些特定的細節,因此它們都不應當被解釋為限制本申請的范圍。另外,在本實用新型的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或實施方式中示出的元素和特征相結合。在某些示例實施方式中,為了清楚的目的,沒有在附圖和說明中詳細地描述眾所周知的過程、結構和技術。
下面參考附圖結合具體實施方式介紹本申請提供的信息處理方法。其中,按照多詞單元的提取方式、對提取得到的多詞單元進行翻譯的順序來介紹本申請提供的信息處理方法。
多詞單元的提取方式的實施方式一
本實施方式提供一種多詞單元的提取方式,具體如下。
從機器翻譯系統的語料庫中獲取雙語的平行語料,該平行語料是對兩種語言進行篇章、段落、語句等的對齊處理后的成對的信息,以雙語為漢語和英語為例,例如得到如圖1所示的平行語料,并獲取如圖2所示的漢語語料和英語語料之間的詞的互譯關系,其中,箭頭表示詞之間的對應關系。其中,漢語語料和英語語料之間的詞的互譯關系以及下文所述的英文端詞性標注和英文多詞單元的提取既可以人為實現,也可以通過設置相應的操作程序由機器實現,本文對此不做限制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310325244.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:冷鐓機送料機械手裝置
- 下一篇:一種C形套環組合模





