[發(fā)明專利]翻譯文件的拆分和分配方法有效
| 申請?zhí)枺?/td> | 201210085140.4 | 申請日: | 2012-03-28 |
| 公開(公告)號: | CN102622340A | 公開(公告)日: | 2012-08-01 |
| 發(fā)明(設(shè)計)人: | 張馬成;王興強;伍華;楊明;王小龍 | 申請(專利權(quán))人: | 成都優(yōu)譯信息技術(shù)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/28 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 謝敏 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 翻譯 文件 拆分 分配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種辦公文件拆分和分配方法,具體涉及翻譯文件的拆分和分配方法。
?
背景技術(shù)
對于現(xiàn)在的社會,國際交上的交流成家常便飯。隨之帶來的翻譯量越來越大,文件字?jǐn)?shù)越來越多。
以現(xiàn)在CAT技術(shù)的流行,翻譯速度大大提升。但是在翻譯前的準(zhǔn)備過程往往占據(jù)了相當(dāng)長的時間。例如對于翻譯公司來說,一份約3萬字的文件分別給10個人做,在前期需要用時半天甚至更久的時間來完成文件拆分和分配。更嚴(yán)重的事,猶豫文字過多,很容易導(dǎo)致分割時視覺混淆導(dǎo)致拆分有誤。許多文件中會有很多段落是完全相同的,這樣翻譯只是多了一些無用的事。這樣無形的增加了翻譯成本。
而目前市面上所有的拆分工具器目的是為了將文件化整為零,方便攜帶,其算法按字節(jié)流分割。此方法對文字的分割基本是無用的。所以翻譯界在翻譯文字過多文件時往往需要多個人同時進行翻譯,翻譯前都會花大量時間用于文字的拆分。
?
發(fā)明內(nèi)容
本發(fā)明克服了現(xiàn)有技術(shù)的不足,提供一種對需要翻譯的文件進行拆分和分配的方法,該方法將多種辦公文件按段算字?jǐn)?shù)的方法直接拆分成指定份數(shù),再分發(fā)給譯員進行翻譯,而且在拆分之前先對是否有隱藏文件進行處理,該方法從文件的分割,隱藏相同段落,到分配可以將整個時間減少到3-10分鐘。這樣就提高了翻譯效率,避免了重復(fù)翻譯,解決了現(xiàn)有技術(shù)中存在的技術(shù)問題。
為解決上述的技術(shù)問題,本發(fā)明采用以下技術(shù)方案:
一種翻譯文件的拆分和分配方法,包括以下步驟:
步驟1,開始;
步驟2,導(dǎo)入文件;
步驟3,進行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置,包括設(shè)置誤差值D;
步驟4,預(yù)處理,得到導(dǎo)入文件格式,打開文件,檢測里面的內(nèi)容,分析出可分成的份數(shù)?;
步驟5,判斷用戶是否需要隱藏相同段落,如果是進入步驟6,如果不是直接進入步驟7;
步驟6:遍歷文件找出相同段落,去除相同段落;
步驟7:根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進行選擇,確定分成的份數(shù)為N;
步驟8:導(dǎo)出拆分文件選擇路徑;
步驟9:根據(jù)用戶所選份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進行拆分,根據(jù)誤差百分比進行以段為主,字?jǐn)?shù)為輔的拆分法,具體包括:
步驟9-1,算出總字?jǐn)?shù)M和找出總段數(shù)G,用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A;
步驟9-2,拆分出第一份:依次遍歷第一至第G段,從第一段開始,若第一段的字?jǐn)?shù)大于或等于A-A*D,則將第一段作為第一份拆分出來,若第一段的字?jǐn)?shù)小于A-A*D,則計算第一段和第二段的總字?jǐn)?shù),若總字?jǐn)?shù)次大于或等于A-A*D,則將第一、二段作為第一份拆分出來,若不是,則再計算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第一份拆分出來;
步驟9-3,拆分出第二份:依次遍歷步驟9-2拆分之后余下的段落,從余下的第一段開始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來,若余下的第一段的字?jǐn)?shù)小于A-A*D,則計算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來,若不是,則再計算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第二份拆分出來;
步驟9-4,拆分出第三份:依次遍歷步驟9-3拆分之后余下的段落,從余下的第一段開始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來,若余下的第一段的字?jǐn)?shù)小于A-A*D,則計算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來,若不是,則再計算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第三份拆分出來;
……
以此類推直至步驟9-N,?拆分出第N-1份:依次遍歷步驟9-N-2拆分之后余下的段落,從余下的第一段開始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來,若余下的第一段的字?jǐn)?shù)小于A-A*D,則計算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來,若不是,則再計算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第N-1份拆分出來;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都優(yōu)譯信息技術(shù)有限公司,未經(jīng)成都優(yōu)譯信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210085140.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





