[發明專利]一種自動校對姓名的方法及裝置有效
| 申請號: | 200910236522.0 | 申請日: | 2009-10-23 |
| 公開(公告)號: | CN102043763A | 公開(公告)日: | 2011-05-04 |
| 發明(設計)人: | 李少明 | 申請(專利權)人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21;G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 校對 姓名 方法 裝置 | ||
技術領域
本發明涉及文字校對技術領域,尤其涉及一種自動校對姓名的方法及裝置。
背景技術
目前在對文字校對領域中,當對文章中多次出現的姓名進行校對時,首先需要定義姓名詞條,然后通過該姓名詞條校對文章中出現的姓名。校對的過程包括:判斷同一姓名前后是否一致,或判斷姓名是否正確。通過姓名詞條校對文章中出現姓名的過程如圖1所示,該過程具體包括以下步驟:
S101:根據所校對的文章中出現的姓名,定義姓名詞條,其中該定義的姓名詞條中包括該校對的文章中出現的姓名。
例如所校對的文章中出現的姓名為李小鋒,則定義姓名詞條,該姓名詞條中包括李小鋒,并且確定該姓名為正確姓名。
S102:將出現的姓名的變形添加到姓名詞條中。
例如對于上述姓名李小鋒,其可能出現的變形包括:李曉鋒、李小峰等等,將李曉鋒、李小峰也添加到姓名詞條中,該變形為需要校對出來的錯誤姓名。
S103:根據姓名詞條對所校對的文章中出現的姓名進行校對,當確定文章中發現姓名詞條中定義的錯誤姓名時,則提示錯誤,并提示用戶修改。
現有技術基于姓名詞條的姓名校對方法,當所校對的文章中出現多個姓名時,必須遍歷所有需要校對的姓名,將該需要校對的姓名定義到姓名詞條中,并且增加該姓名的變形。姓名詞條的方式只可以校對出姓名詞條中存在的姓名,及姓名的變形,當某一姓名,姓名的某一變形未添加到姓名詞條中時,采用該方式就對該姓名的變形方式校對不出。只能在事后通過人工校對進行彌補,把相對應的姓名變形添加到姓名詞條中,以防下次再出現類似的錯誤。但對于不同的文章需要校對的姓名也不同,這樣每校對一篇文章就需要去修改和更新姓名詞條,因此定義姓名詞條的方式比較繁瑣,校對的準確率也比較低,對應沒有想到姓名的變形就校對不出來,容易出現不可挽回的事故。另外姓名詞條的增加由于要考慮到盡可能多的姓名的變形,因此姓名詞條的定義也成為了一項非常艱巨不可完成的任務。
發明內容
有鑒于此,本發明實施例提供一種自動校對姓名的方法及裝置,用以解決現有技術中姓名校對工作效率低、準確性低的問題。
本發明實施例提供的一種自動校對姓名的方法,包括:
校對姓名裝置根據設置的姓氏詞庫,在待校對的文章中進行匹配,獲取每個包含姓氏的候選姓名;
統計每個候選姓名中每個字出現的頻率,提取每個真實姓名;
根據所述提取的每個真實姓名,及待校對的文章的長度,確定所述待校對的文章中的每個目標真實姓名;
采用確定的所述每個目標真實姓名,對所述待校對的文章中的姓名進行校對。
本發明實施例提供的一種自動校對姓名的裝置,包括:
候選姓名確定模塊,用于根據設置的姓氏詞庫,在待校對的文章中進行匹配,獲取每個包含姓氏的候選姓名;
真實姓名提取模塊,用于統計每個候選姓名中每個字出現的頻率,提取每個真實姓名;
目標真實姓名確定模塊,用于根據所述提取的每個真實姓名,及待校對的文章的長度,確定所述待校對的文章中的每個目標真實姓名;
校對模塊,用于采用確定的所述每個目標真實姓名,對所述待校對的文章中的姓名進行校對。
本發明實施例提供了一種自動校對姓名的方法及裝置,該方法包括:校對姓名裝置根據設置的姓氏詞庫,在待校對的文章中進行匹配,獲取每個包含姓氏的候選姓名;統計每個候選姓名中每個字出現的頻率,提取每個真實姓名;根據每個真實姓名,及該待校對的文章的長度,確定每個目標真實姓名;采用該確定的每個目標真實姓名,對該待校對的文章進行校對。在本發明實施例中校對姓名裝置通過姓氏詞庫在待校對的文章中確定包含目標真實姓名的候選姓名,從而節省了定義每個姓名及姓名變型的繁瑣工作,提高了姓名校對的效率,并且由于根據待校對文章中的每個真實姓名,確定目標真實姓名,從而提高了姓名校對的準確率。
附圖說明
圖1為現有技術中校對姓名的方法流程圖;
圖2為本發明實施例提供的一種自動校對姓名的方法流程圖;
圖3A為本發明實施例提供的確定目標真實姓名的結果示意圖;
圖3B為本發明實施例提供的一種自動校對姓名的裝置結構圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910236522.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大容量電池并聯接入系統
- 下一篇:一種快速充電型移動電源





