[發(fā)明專利]一種詞典創(chuàng)建方法及設備有效
| 申請?zhí)枺?/td> | 201710677546.4 | 申請日: | 2017-08-09 |
| 公開(公告)號: | CN107832285B | 公開(公告)日: | 2021-02-23 |
| 發(fā)明(設計)人: | 張惠亮;趙曉慶;劉勝;吳鋒海 | 申請(專利權)人: | 聯(lián)動優(yōu)勢科技有限公司 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/186 |
| 代理公司: | 北京同達信恒知識產(chǎn)權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100082 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 詞典 創(chuàng)建 方法 設備 | ||
本發(fā)明公開了一種詞典創(chuàng)建方法及設備,以將相同語義的分詞用同一個屬性標識表示,盡可能減少屬性標識的數(shù)量,節(jié)約存儲空間。其中的詞典創(chuàng)建方法包括:從預先建立的至少一個通知信息模板中的每個通知信息模板選取第一屬性標識;其中,所述通知信息模板包括至少一個屬性標識,所述屬性標識用于指示所述通知信息包括的分詞;所述第一屬性標識用于指示專有名詞開始或結束;從所述每個通知信息模板中選取在所述第一屬性標識之前和/或之后的N個連續(xù)屬性標識,N為正整數(shù);根據(jù)所述第一屬性標識及所述N個連續(xù)屬性標識,將所述N個連續(xù)屬性標識中的部分屬性標識或全部屬性標識替換為一個新的屬性標識。
技術領域
本發(fā)明涉及計算機技術領域,特別涉及一種詞典創(chuàng)建方法及設備。
背景技術
人們在使用類似手機的終端時,經(jīng)常會收到一些通知類信息。通知類信息是指運營商或企業(yè)機構,例如金融機構等向用戶發(fā)送的通知信息,如運營商資費信息、機票預訂信息、銀行卡消費消息等。
目前對于通知信息,都是事先建立一個模板,例如,尾號1234的儲蓄卡賬戶09:20通過ATM轉出290元,所建立的模板是,文字不變,數(shù)字部分用標識Nu來代替,字母部分用標識Zm來代替。因此,得到的模板就是:尾號Nu儲蓄卡賬戶NuNu通過Zm轉出Nu元。
而由于現(xiàn)有技術中的模板,文字就是文字本身,所有同一類通知信息就存在多個模板。例如,通知信息:您賬戶5678信用卡賬戶01月03日21:21發(fā)生網(wǎng)銀快捷扣款31美元的模板為:您賬戶Nu信用卡賬戶Nu月Nu日Nu Nu發(fā)生網(wǎng)銀快捷扣款Nu美元。其實,兩條通知信息都表達了相同的意思,但是存在兩個模板,這就導致為通知信息建立的模板較多,浪費存儲空間。
發(fā)明內容
本發(fā)明實施例提供一種詞典創(chuàng)建方法及設備,以將相同語義的分詞用同一個屬性標識表示,盡可能減少屬性標識的數(shù)量,節(jié)約存儲空間。
第一方面,本發(fā)明一實施例提供了一種詞典創(chuàng)建方法,所述詞典創(chuàng)建方法包括:
從預先建立的至少一個通知信息模板中的每個通知信息模板選取第一屬性標識;其中,所述通知信息模板包括至少一個屬性標識,所述屬性標識用于指示所述通知信息包括的分詞;所述第一屬性標識用于指示專有名詞開始或結束;
從所述每個通知信息模板中選取在所述第一屬性標識之前和/或之后的N個連續(xù)屬性標識,N為正整數(shù);
根據(jù)所述第一屬性標識及所述N個連續(xù)屬性標識,將所述N個連續(xù)屬性標識中的部分屬性標識或全部屬性標識替換為一個新的屬性標識。
可選的,在從所述每個通知信息模板中選取在所述第一屬性標識之前和/或之后的N個連續(xù)屬性標識之后,還包括:
從所述第一屬性標識及所述N個連續(xù)屬性標識中選取在所述至少一個通知信息模板中出現(xiàn)的次數(shù)大于或者等于第一預設閾值的所述第一屬性標識及所述N個連續(xù)屬性標識;
和/或,
從所述第一屬性標識及所述N個連續(xù)屬性標識選取在所述至少一個通知信息模板中出現(xiàn)的次數(shù)與所述至少一個通知信息模板的數(shù)量的比值等于或大于第二預設閾值的所述第一屬性標識及所述N個連續(xù)屬性標識。
可選的,根據(jù)所述第一屬性標識及所述N個連續(xù)屬性標識,將所述N個連續(xù)屬性標識中的部分屬性標識或全部屬性標識替換為一個新的屬性標識,包括:
若所述第一屬性標識指示專有名詞開始,則將所述第一屬性標識與用于指示所述專有名詞結束的屬性標識之間的M個連續(xù)屬性標識,確定為要替換所述M個連續(xù)屬性標識;其中,用于指示所述專有名詞結束的屬性標識位于所述第一屬性標識之后。
可選的,根據(jù)所述第一屬性標識及所述N個連續(xù)屬性標識,將所述N個連續(xù)屬性標識中的部分屬性標識或全部屬性標識替換為一個新的屬性標識,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯(lián)動優(yōu)勢科技有限公司,未經(jīng)聯(lián)動優(yōu)勢科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710677546.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 圖冊創(chuàng)建設備、圖冊創(chuàng)建方法和圖冊創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對象的方法
- 報告創(chuàng)建系統(tǒng)、報告創(chuàng)建裝置以及報告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報創(chuàng)建方法和剪報創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報告創(chuàng)建系統(tǒng)和報告創(chuàng)建方法
- 創(chuàng)建改進的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法





