[發明專利]計算機新詞學習方法與系統無效
| 申請號: | 00132955.3 | 申請日: | 2000-11-16 |
| 公開(公告)號: | CN1354422A | 公開(公告)日: | 2002-06-19 |
| 發明(設計)人: | 楊立偉 | 申請(專利權)人: | 意藍科技股份有限公司 |
| 主分類號: | G06F9/46 | 分類號: | G06F9/46 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 黃敏 |
| 地址: | 臺灣省*** | 國省代碼: | 臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 新詞 學習方法 系統 | ||
1.一種計算機新詞學習方法,包含以下程序:
一子詞記錄程序,是將記錄在一無詞集的至少一無詞部分分解成至少一子詞,并將該子詞記錄于一子詞集中,其中該無詞部分是指在一計算機可讀取的文件中,任何相鄰單字均無法構成計算機可辨識的詞匯的部分;
一第一刪除程序,是分別計算各該等子詞的出現次數,并將出現次數小于一預定值的子詞自該子詞集中刪除;以及
一第二刪除程序,是自該子詞集中依序選取不相同的一第一子詞與一第二子詞,當該第一子詞被包含于該第二子詞中,且該第一子詞的出現次數不大于該第二子詞時,將該第一子詞自該子詞集刪除,
藉以由該子詞集中產生計算機可辨識的新詞。
2.如權利要求1所述的計算機新詞學習方法,還包含:
一詞辨識程序,是對一文件進行詞辨識處理;以及
一無詞部分記錄程序,是當該文件中具有至少一無詞部分時,將該無詞部分記錄于該無詞集中。
3.如權利要求1所述的計算機新詞學習方法,還包含:
一判斷程序,是判斷該子詞集是否為空集,并當該子詞集為空集時,結束該計算機新詞學習方法的流程。
4.如權利要求1所述的計算機新詞學習方法,還包含:
一第三刪除程序,是在該第二刪除程序之后,還將該子詞集中出現次數最多的子詞以外的子詞刪除。
5.如權利要求1所述的計算機新詞學習方法,還包含:
一無詞部分分割程序,包括
將包含該新詞的無詞部分自該無詞集移除;
當包含該新詞的無詞部分中,位于該新詞之前的單字數量為兩個以上時,將該無詞部分中位于該新詞之前的部分視為另一無詞部分,并將其加入至該無詞集中;且
當包含該新詞的無詞部分中,位于該新詞之后的單字數量為兩個以上時,將該無詞部分中位于該新詞之后的部分視為另一無詞部分,并將其加入至該無詞集中。
6.如權利要求1所述的計算機新詞學習方法,還包含:
一子詞集清空程序,是清空該子詞集并回到該子詞記錄程序。
7.如權利要求1所述的計算機新詞學習方法,其中
該預定值為2。
8.一種計算機新詞學習系統,包含:
一子詞記錄模塊,是將記錄于一無詞集的至少一無詞部分分解成至少一子詞,并將該子詞記錄于一子詞集中,其中該無詞部分是指在一計算機可讀取的文件中,任何相鄰單字均無法構成計算機可辨識的詞匯的部分;
一第一刪除模塊,是分別計算各該等子詞的出現次數,并將出現次數小于一預定值的子詞自該子詞集中刪除;以及
一第二刪除模塊,是自該子詞集中依序選取不相同的一第一子詞與一第二子詞,當該第一子詞被包含于該第二子詞中,且該第一子詞的出現次數不大于該第二子詞時,將該第一子詞自該子詞集刪除,
藉以由該子詞集中產生計算機可辨識的新詞。
9.如權利要求8所述的計算機新詞學習系統,還包含:
一詞辨識模塊,是對一文件進行詞辨識處理;以及
一無詞部分記錄模塊,是當該文件中具有至少一無詞部分時,將該無詞部分記錄于該無詞集中。
10.如權利要求8所述的計算機新詞學習系統,還包含:
一第三刪除模塊,是將該子詞集中出現次數最多的子詞以外的子詞刪除。
11.如權利要求8所述的計算機新詞學習系統,還包含:
一無詞部分分割模塊,其中
將包含該新詞的無詞部分自該無詞集移除;
當包含該新詞的無詞部分中,位于該新詞之前的單字數量為兩個以上時,將該無詞部分中位于該新詞之前的部分視為另一無詞部分,并將其加入至該無詞集中;且
當包含該新詞的無詞部分中,位于該新詞之后的單字數量為兩個以上時,將該無詞部分中位于該新詞之后的部分視為另一無詞部分,并將其加入至該無詞集中。
12.如權利要求8所述的計算機新詞學習系統,其中
該預定值為2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于意藍科技股份有限公司,未經意藍科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/00132955.3/1.html,轉載請聲明來源鉆瓜專利網。





