[發明專利]一種自動更正部分文字的方法-由中文詞性判斷有效
| 申請號: | 201710963696.1 | 申請日: | 2017-10-17 |
| 公開(公告)號: | CN107729318B | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 王蓮 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430073 湖北省武漢市東湖開發區光谷軟件*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 更正 部分 文字 方法 中文 詞性 判斷 | ||
本發明主要涉及對“的”、“得”、“地”三字的判斷更正。譯員在翻譯完成稿件后,本方法將自動檢查譯員稿件中使用的“的”和“得”和“地”,根據規則,如果用錯,會自動更正成正確的“的”或“得”或“地”。根據本發明提供的方法,首先檢測出文檔中所有包含“的”、“得”、“地”的句子,根據分詞方法判斷其屬于實詞還是虛詞;屬于實詞的時候,直接跳過;否則,根據相關規則進行“的”、“得”、“地”的修正判斷。采用本發明,可以提高翻譯文檔的表達準確性,避免現有技術中人工核實的效率低下問題。
技術領域
本發明屬于文檔處理技術領域,尤其涉及一種自動更正部分文字的方法。
背景技術
在中文語法中,“的”、“得”、“地”用作虛詞時,是連接文章中詞與詞,字與字之間的重要橋梁,在各種書面表達中使用十分廣泛。然而,很多人并沒有清楚的知曉三者的區別,通常相互混用,甚至全部用“的”代替。
從語法研究上看,呂叔湘、朱德熙所著《語法修辭講話》認為“的”兼職過多,負擔過重,而力主“的、地、得”嚴格分工。50 年代以來的諸多現代漢語論著和教材,一般也持這一主張。
從書面語中的使用情況看,“的”與“地”、“得”的分工也日趨明確,例如,在邏輯性很強的論述性、說明性語言中,如法律條款、學術論著、外文譯著、教科書等情形中,必須嚴格區分三者的使用情況,才能保證書面語言的精確。特別是將上述相關的外文材料,例如法律條款/新聞稿/公文,翻譯成中文時,為了保證原文的準確性,更是不能混淆。無論從新聞出版界奉為標準的《現代漢語詞典》“的”“得”“地”詞條來看,還是《人民日報》、新華社和正規出版社的實踐來看,都是嚴格區分的。“的”、“得”、“地”三字的亂用,只會導致譯文最終貽笑大方。
但是,當前大多數翻譯人員在翻譯時并沒有注意到這一問題,經常出現翻譯錯誤,或者隨意的給出“的”、“得”、“地”的某一種翻譯,而沒有兼顧原文的準確含義;另外,在翻譯時如果一一準確推敲該采用哪一種表達,又會導致翻譯效率低下,因此,譯員也有可能選擇翻譯時不嚴格推敲,事后再校對的方法,但是這種方式并不能保證結果的準確性,同時也耗費譯員精力。
簡單來說,“的、地、得”在普通話里都讀輕聲“de”,但在書面語中有必要寫成三個不同的字:在定語后面寫作“的”,在狀語后面寫作“地”,在補語前寫作“得”。這樣做的好處,就是可使書面語言精確化。
雖然這一使用規則為語言學者所熟知,但是對于譯員來說,其需要再給出中文句子翻譯結果之后才能使用上述規則,在文檔翻譯量巨大的情形下,一一人工甄別是不現實的;另外,大部分翻譯工作者不是嚴格掌握語法規則的研究人員,其注重的可能更多是實質內容本身,而不會重視這三個字的重要性;更重要的是,“的、地、得”只有在做虛詞的時候才會出現上述情況,處于實詞構成部分的“的、地、得”是不需要考慮上述問題的,因此,簡單采用三字查找的方式,徒增工作量。
另外,即使知曉了上述“的、地、得”的使用規則,但是在中文語料中,對于所謂定語/狀語/補語的定義,由于計算機并不能嚴格定義其特征,無法精確識別,因此,無法直接將上述判斷方法計算機流程化實現。
發明內容
為了解決文檔中有關“的、地、得”錯誤使用的問題,本發明提供了一種自動更正方法。該方法首先定位出文檔中所有作為虛詞使用的“的、地、得”,然而根據相應的規則,對其進行更正。
所述方法可以采用計算機技術全自動的實現。根據處理思路的不同,存在兩種不同的更正方法。
在第一方面,本發明提供的一種自動更正部分文字的方法,包括如下步驟:
S1. 對待更正文檔進行分句處理,得到多個句子;
S2. 提取包含所述特定文字的句子,將其依序存儲到序列表中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710963696.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種微陣列式偏振光羅盤的定向方法
- 下一篇:定位裝置和系統





