[發明專利]一種基于詞綴的用于對未知詞進行語義分類的方法有效
| 申請號: | 201210361150.6 | 申請日: | 2012-09-25 |
| 公開(公告)號: | CN102929858A | 公開(公告)日: | 2013-02-13 |
| 發明(設計)人: | 強彥;韓曉紅;路景貴;趙涓涓;裴博;劉濤 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 030024 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 詞綴 用于 未知 進行 語義 分類 方法 | ||
1.一種基于詞綴的用于對未知詞進行語義分類的方法,其特征在于,包括以下步驟:
對于用戶輸入的任一未知詞w=AB,針對其詞根A或B,在字典中查找與其具有相同詞根的詞作為該未知詞的相似詞,分析各個相似詞的構詞方式,對于不是有內容部分擴展而來的情況,根據同義詞詞林字典分析各個相似詞的內容部分與該未知詞的內容部分的相似度,將相似度為1的內容部分的相似詞作為該未知詞的語義類;對于各相似詞是由其內容部分擴展而來的情況,認為該未知詞也是由其內容部分擴展而來,此時只需要在同義詞詞林字典中查找出其內容部分的語義類,進而,將該語義類作為該未知詞的語義類;對于詞綴對其語義有較大影響的情況,根據同義詞詞林字典分別計算該未知詞的內容部分與各相似詞內容部分的語義類的相似度,并設定閾值,若其相似度大于該閾值則將其疊加在該相似詞的內容部分的語義類的值上,篩選出語義類值最大的相似詞的語義類作為該未知詞的語義類。
2.如權利要求1所述方法,其特征在于,完全基于未知詞的內容部分與相似詞內容部分的相似度,其詞綴部分對其語義類別沒有影響的情況。
3.如權利要求1所述方法,其特征在于,對于計算未知詞與相似詞的內容部分的相似度,是完全基于相似詞詞林的語義類相似度計算的。
4.如權利要求1所述方法,其特征在于,對于未知詞的相似詞wr=AB,若C(wr)=C(B),其中C()表示該詞的語義類,此時A為相似詞wr和未知詞w的詞綴,在這種情況下,對于未知詞可以很確信的將C(B)作為它的語義類,即C(w)=C(B)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210361150.6/1.html,轉載請聲明來源鉆瓜專利網。





