[發明專利]一種平行語料按翻譯質量進行分類的方法及系統在審
| 申請號: | 201810166481.1 | 申請日: | 2018-02-28 |
| 公開(公告)號: | CN108537246A | 公開(公告)日: | 2018-09-14 |
| 發明(設計)人: | 席斌;張馬成;李明;彭成超;王興強 | 申請(專利權)人: | 成都優譯信息技術股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06F17/28 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 宋輝 |
| 地址: | 610000 四川省成都市中國(四川)自*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語料 平行 分類 算法 前向神經網絡 翻譯結果 映射關系 翻譯 改進型 | ||
本發明公開了一種平行語料按翻譯質量進行分類的方法,包括以下步驟:S1:建立平行語料評分和平行語料等級之間的映射關系;S2:將平行語料按照翻譯結果進行評分;S3:依據平行語料評分和平行語料等級之間的映射關系對翻譯結果的評分分值使用前向神經網絡模型進行分類。本發明還公開了采用這種方法的系統。本發明一種平行語料按翻譯質量進行分類的方法及系統,無論是采用BLEU算法、改進型BLEU算法或者METEOR算法,都可以通過前向神經網絡進行分類,有效提高了本發明的通用性和適用范圍。
技術領域
本發明涉及翻譯領域,具體涉及一種平行語料按翻譯質量進行分類的方法及系統。
背景技術
隨著經濟全球化及國際互聯網的飛速發展,自然語言的翻譯在促進政治、經濟、文化交流等方面起到越來越重要的作用。過去在國際交流領域,人們需要對語言文字進行翻譯時,需要采用人工翻譯,耗時耗力,而隨著計算機軟硬件技術的高速發展,計算機翻譯及計算機輔助翻譯得到了越來越廣泛的應用。
平行語料,是指由原文文本及其平行對應的譯語文本構成的雙語或多語語料;為了提高翻譯質量,現有的平行語料普遍采用BLEU算法進行評分,然而BLEU算法的結果往往會受到語料語法、句子長短以及同義詞等影響,所以評分結果準確性較差。
發明內容
本發明所要解決的技術問題是現有的平行語料普遍采用BLEU算法進行評分,然而BLEU算法的結果往往會受到語料語法、句子長短以及同義詞等影響,所以評分結果準確性較差,目的在于提供一種平行語料按翻譯質量進行分類的方法及系統,解決上述問題。
本發明通過下述技術方案實現:
一種平行語料按翻譯質量進行分類的方法,包括以下步驟:S1:建立平行語料評分和平行語料等級之間的映射關系;S2:將平行語料按照翻譯結果進行評分;S3:依據平行語料評分和平行語料等級之間的映射關系對翻譯結果的評分分值使用前向神經網絡模型進行分類。
現有技術中,為了提高翻譯質量,現有的平行語料普遍采用BLEU算法進行評分,然而BLEU算法的結果往往會受到語料語法、句子長短以及同義詞等影響,所以評分結果準確性較差。本發明應用時,建立平行語料評分和平行語料等級之間的映射關系,這種映射關系一般為一對多的映射關系,即平行語料等級對應“一”,而平行語料評分對應“多”;將平行語料按照翻譯結果進行評分,這種評分可以采用現有的評分算法,比如BLEU算法,或者改進型BLEU算法,也可以采用METEOR算法進行評分;然后依據平行語料評分和平行語料等級之間的映射關系對翻譯結果的評分分值使用前向神經網絡模型進行分類;由于通過前向神經網絡模型進行分類,可以將評分相似的語料分到同一類,從而有效的降低了評分誤差;同時,無論是采用BLEU算法、改進型BLEU算法或者METEOR算法,都可以通過前向神經網絡進行分類,有效提高了本發明的通用性和適用范圍。
進一步的,步驟S2中所述評分采用BLEU算法進行評分。
本發明應用時,BLEU算法是成熟算法,一般來說評分結果相對穩定,所以選擇BLEU算法。
進一步的,所述前向神經網絡模型采用感知機模型。
本發明應用時,感知機模型是前向神經網絡模型的一種基礎模型,由于感知機的運行特性,通過引入偏執量,并通過感知機的激活函數進行運算,可以具有更快的收斂速度,減少運算量,非常適合于大量平行語料的分析整理。
一種平行語料按翻譯質量進行分類的系統,包括:用于建立平行語料評分和平行語料等級之間的映射單元;用于將平行語料按照翻譯結果進行評分的評分單元;用于依據平行語料評分和平行語料等級之間的映射關系對翻譯結果的評分分值使用前向神經網絡模型進行分類的前向神經網絡單元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都優譯信息技術股份有限公司,未經成都優譯信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810166481.1/2.html,轉載請聲明來源鉆瓜專利網。





