[發(fā)明專利]一種自動為漢字添加拼音的方法及裝置有效
| 申請?zhí)枺?/td> | 200810055831.3 | 申請日: | 2008-01-09 |
| 公開(公告)號: | CN101482867A | 公開(公告)日: | 2009-07-15 |
| 發(fā)明(設(shè)計(jì))人: | 王銘宇;王全鵬;楊春 | 申請(專利權(quán))人: | 北大方正集團(tuán)有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06F17/21 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 | 代理人: | 黃志華 |
| 地址: | 100871北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自動 漢字 添加 拼音 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及印刷排版技術(shù)領(lǐng)域,尤其涉及一種自動為漢字添加拼音的方法 及裝置。
背景技術(shù)
由于漢字中存在大量的多音字,怎樣確定整篇文檔中的多音字的拼音是一 個很困難的問題。因此,在當(dāng)前各種排版或者文檔處理軟件中,很少具有可以 直接給整段或整篇文章進(jìn)行大數(shù)據(jù)量地添加拼音的功能。現(xiàn)有技術(shù)中常見的添 加拼音方式主要有以下兩種:
基于字和詞級別的添加拼音方式。但是,由于漢字多音字的存在,往往還 需要用戶進(jìn)行選擇以確定該字的拼音。
基于段和篇級別的添加拼音方式。但是,由于確定多音字拼音所采用的方 法運(yùn)算的復(fù)雜性,一般添加拼音的效率很低,并且不是完全自動匹配,遇到多 音字的情況需要用戶進(jìn)行選擇或校正。
綜上所述,現(xiàn)有技術(shù)一般都需要基于中文分詞后查找詞庫的方法來完成自 動為漢字添加拼音,這種方法需要有分詞字典和拼音庫的支持,其復(fù)雜的匹配 運(yùn)算過程對于大量漢字加拼音的情況效率很低,不適于整篇文章等大量數(shù)據(jù)的 加拼音操作。如果不分詞,則準(zhǔn)確率太差,需要進(jìn)行大量的手動校正。因此, 現(xiàn)有技術(shù)為漢字添加拼音的排版工作效率低,并且浪費(fèi)人力。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種自動為漢字添加拼音的方法及裝置,用以解決現(xiàn) 有技術(shù)中存在的為漢字自動添加拼音的工作效率低,準(zhǔn)確性差的問題。
本發(fā)明實(shí)施例提供的自動為漢字添加拼音的方法包括:
分別將用戶選定的需要添加拼音的文字中每兩個相鄰的非漢字字符之間 的漢字收集到漢字?jǐn)?shù)組中;
將用戶選定的需要添加拼音的漢字與預(yù)先設(shè)置的詞庫中的詞進(jìn)行詞匹配 操作,當(dāng)所述漢字?jǐn)?shù)組中連續(xù)的多個漢字與所述詞庫中的同一個詞完全匹配或 部分匹配時,確認(rèn)所述詞匹配操作成功,將匹配成功的所述詞庫中的詞的拼音 添加給相應(yīng)的需要添加拼音的漢字;
當(dāng)所述詞匹配操作失敗時,將所述詞匹配失敗的漢字與預(yù)先設(shè)置的字庫中 的字進(jìn)行字匹配操作,將匹配成功的所述字庫中的字的拼音添加給相應(yīng)的需要 添加拼音的漢字。
本發(fā)明實(shí)施例提供的自動為漢字添加拼音的裝置包括:
第一匹配單元,用于分別將用戶選定的需要添加拼音的文字中每兩個相鄰 的非漢字字符之間的漢字收集到漢字?jǐn)?shù)組中;將用戶選定的需要添加拼音的漢 字與預(yù)先設(shè)置的詞庫中的詞進(jìn)行詞匹配操作,當(dāng)所述漢字?jǐn)?shù)組中連續(xù)的多個漢 字與所述詞庫中的同一個詞完全匹配或部分匹配時,確認(rèn)所述詞匹配操作成 功,將匹配成功的所述詞庫中的詞的拼音添加給相應(yīng)的需要添加拼音的漢字;
第二匹配單元,用于當(dāng)所述詞匹配操作失敗時,將所述詞匹配失敗的漢字 與預(yù)先設(shè)置的字庫中的字進(jìn)行字匹配操作,將匹配成功的所述字庫中的字的拼 音添加給相應(yīng)的需要添加拼音的漢字。
本發(fā)明實(shí)施例,將用戶選定的需要添加拼音的漢字分別與預(yù)先設(shè)置的詞庫 中的詞進(jìn)行詞匹配操作,將匹配成功的所述詞庫中的詞的拼音添加給相應(yīng)的需 要添加拼音的漢字;當(dāng)所述詞匹配操作失敗時,將所述詞匹配失敗的漢字與預(yù) 先設(shè)置的字庫中的字進(jìn)行字匹配操作,將匹配成功的所述字庫中的字的拼音添 加給相應(yīng)的需要添加拼音的漢字。通過該技術(shù)方案,實(shí)現(xiàn)了自動為用戶選定的 文字添加拼音的操作,在保證準(zhǔn)確性的前提下,避免了現(xiàn)有技術(shù)由于需要進(jìn)行 分詞而帶來的復(fù)雜運(yùn)算問題,提高了自動添加拼音的工作效率。
附圖說明
圖1為本發(fā)明實(shí)施例提供的自動為漢字添加拼音的總體方法流程示意圖;
圖2為用戶選定的需要添加拼音的文檔示意圖;
圖3為本發(fā)明實(shí)施例提供的為漢字?jǐn)?shù)組中的漢字添加拼音的具體流程示意 圖;
圖4為采用本發(fā)明實(shí)施例提供的方法為用戶選定的文字添加拼音后的效果 示意圖;
圖5為用戶選定的若干段落的示意圖;
圖6為采用本發(fā)明實(shí)施例提供的方法為用戶選定的若干段落添加拼音后的 效果示意圖。
具體實(shí)施方式
本發(fā)明實(shí)施例,提供了一種自動為漢字添加拼音的方法及裝置。對于選定 的需要添加拼音的文字中每兩個相鄰的非漢字字符之間的漢字,通過將其分別 與預(yù)先設(shè)置的詞庫中的詞或字庫中的字進(jìn)行匹配,以得到需要添加的拼音,從 而在不進(jìn)行分詞的情況下達(dá)到與分詞后再加拼音同樣的準(zhǔn)確率,提高為漢字添 加拼音的效率。
下面結(jié)合附圖,說明本發(fā)明的具體實(shí)施方式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北大方正集團(tuán)有限公司;北京北大方正電子有限公司,未經(jīng)北大方正集團(tuán)有限公司;北京北大方正電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810055831.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





