[發明專利]詞義消歧方法和系統無效
| 申請號: | 200910129454.8 | 申請日: | 2009-03-20 |
| 公開(公告)號: | CN101840397A | 公開(公告)日: | 2010-09-22 |
| 發明(設計)人: | 李建強;趙彧;劉博 | 申請(專利權)人: | 日電(中國)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 李曉冬;南霆 |
| 地址: | 100007 北京市東城區東四十*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞義 方法 系統 | ||
1.一種利用語義特征進行詞義消歧的方法,包括:
輸入目標詞匯w,其具有多種詞義{w1,w2,...wn};
從相關本體抽取所述目標詞匯所在的概念以及在本體中的概念上下文;
基于所述概念上下文對所述目標詞匯的各種詞義進行打分;以及
根據所述打分結果選擇所述目標詞匯的適當詞義。
2.如權利要求1所述的方法,其中所述本體具有層次化分類模式。
3.如權利要求1所述的方法,其中對所述目標詞匯的每種詞義wj(j=1,2,...n)進行打分的步驟包括:
根據所述概念上下文中的語義關系搜索與所述目標詞匯w相關的共現詞匯{a1,a2,...am},所述共現詞匯ai(i=1,2,...m)是出現在所述目標詞匯的鄰近概念中的上下文詞匯;
針對每個所述共現詞匯ai,根據該共現詞匯與所述目標詞匯之間的語義路徑長短,對該共現詞匯賦予一權重W(ai);
基于詞典中給出的詞義定義,計算所述目標詞匯的每種詞義wj與每個共現詞匯ai(i=1,2,...m)之間的相關度R(wj/ai);以及
計算每種詞義wj相對于所有共現詞匯{a1,a2,...am}的總相關度作為該詞義wj對應的得分。
4.如權利要求3所述的方法,其中所述計算詞義wj與每個共現詞匯ai之間的相關度R(wj/ai)的步驟包括:
針對共現詞匯ai在詞典中具有的每種詞義(l=1,2,...r),計算詞義wj與該詞義之間的相關度并且
對詞義wj相對于所述共現詞匯ai的各種詞義的相關度求和,以作為詞義wj與共現詞匯ai之間的相關度,即
5.如權利要求1所述的方法,其中對所述目標詞匯的每種詞義wj(j=1,2,...n)進行打分的步驟包括:
從所述本體中提取出以所述目標詞匯為中心的、對應于所述目標詞匯的概念上下文的子層次結構;
從詞典中提取與所述目標詞匯的每種詞義wj相對應的詞義參考層次結構;以及
將從所述本體中提取出的對應于所述目標詞匯的概念上下文的子層次結構與詞典中對應于每種詞義wj的詞義參考層次結構進行圖匹配以計算在拓撲結構上的相似度,作為該詞義wj對應的得分。
6.如權利要求1所述的方法,還包括:
以基于所述概念上下文計算出的每種詞義wj(j=1,2,...n)的得分作為第一打分結果Rank1(wj);
利用基于文本上下文的傳統詞義消歧方法對所述詞義wj計算第二打分結果Rank2(wj);以及
計算所述詞義wj的綜合得分Rank(wj)=θRank1(wj)+(1-θ)Rank2(wj),其中θ是預定權重,0<θ<1。
7.如權利要求1所述的方法,其中所述選擇目標詞匯的適當詞義的步驟包括:
選擇分值大于一預定閾值的詞義作為所述適當詞義。
8.如權利要求7所述的方法,其中所選詞義的數目與所述目標詞匯在詞典中所有詞義的數目成比例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日電(中國)有限公司,未經日電(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910129454.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:大水面無圍欄規模生態養殖中華鱉的方法
- 下一篇:共享上網用戶識別方法及裝置





