[發明專利]用于對命名實體進行分類的方法和裝置有效
| 申請號: | 201010506217.1 | 申請日: | 2010-09-29 |
| 公開(公告)號: | CN102436456A | 公開(公告)日: | 2012-05-02 |
| 發明(設計)人: | 倪淵;張雷;裘照明 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華;趙林琳 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 命名 實體 進行 分類 方法 裝置 | ||
1.一種用于對命名實體進行分類的方法,包括:
從鏈接開放數據LOD數據集中讀取與待分類命名實體對應的LOD節點;
將所述與該待分類命名實體對應的LOD節點的類型屬性作為所述待分類命名實體的標注類型;
讀取候選類型;和
根據所述標注類型計算該待分類命名實體屬于所述候選類型的可能性。
2.如權利要求1所述的方法,其中根據所述標注類型計算該待分類命名實體屬于所述候選類型的可能性包括:
將候選類型和標注類型映射到中間本體的節點;
根據映射到的中間本體節點之間的關系,計算所述候選類型和各標注類型之間的屬性匹配指標;和
對對應于同一候選類型的各屬性匹配指標進行統計處理,從而得到待分類命名實體屬于該候選類型的可能性。
3.如權利要求2所述的方法,其中對對應于同一候選類型的各屬性匹配指標進行統計處理包括:
根據屬性匹配指標所對應的LOD節點的特性對所述多個屬性匹配指標進行加權平均。
4.如權利要求1所述的方法,其中從LOD數據集中讀取與該待分類命名實體對應的LOD節點包括:
通過比較待分類命名實體與LOD節點中以以下任意一種為謂詞的屬性條目所記載的名稱屬性來確定與所述待分類命名實體對應的LOD節點:
rdfs:label;
dbpedia:birth?name;或
foaf:name。
5.如權利要求1所述的方法,進一步包括將與該待分類命名實體對應的LOD節點具有重定向關系的LOD節點也作為與該待分類命名實體對應的LOD節點。
6.如權利要求2所述的方法,其中對對應于同一候選類型的各屬性匹配指標進行統計處理,從而得到待分類命名實體屬于該候選類型的可能性包括:
利用屬性匹配指標與LOD節點的對應關系,將所述屬性匹配指標轉換為節點匹配指標;
對對應于同一候選類型的各節點匹配指標進行統計處理,從而得到待分類命名實體屬于該候選類型的可能性。
7.如權利要求6所述的方法,其中將所述屬性匹配指標轉換為節點匹配指標包括:
對對應于同一個LOD節點的多個屬性匹配指標進行平均,從而得到節點匹配指標。
8.如權利要求6所述的方法,其中將所述屬性匹配指標轉換為節點匹配指標包括:
以對應于同一個LOD節點的多個屬性匹配指標中的最大值作為節點匹配指標。
9.如權利要求6所述的方法,其中將所述屬性匹配指標轉換為節點匹配指標包括:
如果對應于同一候選類型的各節點匹配指標中,有指示存在抵觸的屬性匹配指標,則將所述節點匹配指標設置為指示存在抵觸。
10.如權利要求9所述的方法,進一步包括:
根據對應于同一候選類型的各節點匹配指標中,指示存在抵觸的屬性匹配指標的數目與未指示存在抵觸的屬性匹配指標的數目之間的關系,確定是否將所述節點匹配指標設置為指示存在抵觸。
11.一種用于對命名實體進行分類的裝置,包括:
LOD節點讀取裝置,配置為從鏈接開放數據LOD數據集中讀取與待分類命名實體對應的LOD節點;
標注類型確定裝置,配置為將所述與該待分類命名實體對應的LOD節點的類型屬性作為所述待分類命名實體的標注類型;
候選類型讀取裝置,配置為讀取候選類型;和
可能性確定裝置,配置為根據所述標注類型計算該待分類命名實體屬于所述候選類型的可能性。
12.如權利要求11所述的裝置,其中所述可能性確定裝置包括:
配置為將候選類型和標注類型映射到中間本體的節點的裝置;
配置為根據映射到的中間本體節點之間的關系,計算所述候選類型和各標注類型之間的屬性匹配指標的裝置;和
配置為對對應于同一候選類型的各屬性匹配指標進行統計處理,從而得到待分類命名實體屬于該候選類型的可能性的裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010506217.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:POS機的外殼及POS機
- 下一篇:一種剪切層流動控制方法





