[發明專利]一種標準檢索智能分詞方法有效
| 申請號: | 201410024472.0 | 申請日: | 2014-01-20 |
| 公開(公告)號: | CN103870537B | 公開(公告)日: | 2017-02-01 |
| 發明(設計)人: | 李鳳龍;劉麗梅;王秀芹;馬強 | 申請(專利權)人: | 山東金質信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 濟南舜源專利事務所有限公司37205 | 代理人: | 商金婷 |
| 地址: | 250014 山東省濟南*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標準 檢索 智能 分詞 方法 | ||
1.一種標準檢索智能分詞方法,其特征在于,包括如下步驟:
(1)對輸入的字符串的進行規范化預處理;
(2)判斷當前輸入的字符串是否為編號,如果輸入的是編號,轉步驟(3),反之,轉步驟(4);?
(3)判斷是否到字符串的末尾,如果不是到字符串末尾,則判斷當前字符和上一個字符是否為同一類,同類則直接歸并到上一個字符所在的組中,形成詞段,否則創建新組,并將新組加入到組鏈中,并將該字符計入新組,組成另一個詞段,循環上述操作直到字符串末尾為止,如果是字符串末尾,則針對生成出來的組鏈轉步驟(5);?
(4)采用基于詞典的方式處理,形成分詞并存儲;
(5)根據得到的組鏈,采用基于記憶規律的分詞組合方式,依次利用分詞規則形成分詞,并且在去重過濾后進行存儲。
2.根據權利要求1所述的標準檢索智能分詞方法,其特征在于,所述步驟(5)的分詞規則具體包括簡單詞的分詞組合、相連詞的分詞組合、相連詞的模糊組合和全詞組合。
3.根據權利要求1所述的標準檢索智能分詞方法,其特征在于,所述步驟(1)的規范化預處理包括去除字符串中的首尾空格、回車、換行符、制表符,并將所有小寫字母轉化成大寫字母步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東金質信息技術有限公司,未經山東金質信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410024472.0/1.html,轉載請聲明來源鉆瓜專利網。





