[發明專利]一種基于超節點的常識語義圖譜構建方法和裝置以及基于連接預測的常識補全方法在審
| 申請號: | 201810320164.0 | 申請日: | 2018-04-11 |
| 公開(公告)號: | CN108846000A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 沈瓊;朱嘉奇;王宏安 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 超節點 方法和裝置 圖譜構建 語義關系 語義網絡 預測 短語 常識知識 關聯關系 人工編輯 輔助的 復雜度 詞語 圖譜 集合 提煉 自動化 涵蓋 檢驗 網絡 發現 | ||
1.一種基于超節點的常識語義圖譜構建方法,其特征在于,包括以下步驟:
1)建立超節點,所述超節點代表一個概念或者實體,由一組同義詞集合來表示;
2)建立語義關系,所述語義關系表示概念或實體之間的關聯關系;
3)設置常識的屬性,所述屬性包括常識的置信度和常識檢索的頻率;
4)由所述超節點、所述語義關系和所述屬性構成常識語義圖譜,所述超節點之間以語義關系為邊來連接,所述屬性附屬在所述邊上。
2.如權利要求1所述的方法,其特征在于,所述同義詞集合內的同義詞無序,或者根據同義詞在某個技術領域出現的頻率來排序。
3.如權利要求1所述的方法,其特征在于,所述同義詞集合內的同義詞是中文的一個詞語,或者是一個中文短語。
4.如權利要求1所述的方法,其特征在于,所述關聯關系包括:
a)因果關系,若一個概念導致了另一個概念的產生,則概念與其概念之間為因果關系;
b)隸屬關系,若一個概念是另外一個概念涵義的子集,則兩者之間的關系即為隸屬關系;
c)位置關系,若一個概念和另一個概念是空間的聯系,則兩者之間的關系即為位置關系;
d)動機關系,若一個概念主動或者被動地和另一個聯系,則兩者之間的關系即為動機關系;
e)屬性關系,若一個概念揭示了另一個概念的性質,則兩者之間的關系即為屬性關系;
f)詞源關系,若一個概念和另一個概念產生詞關聯,則兩者之間的關系即為詞源關系;
g)順序關系,若一個概念和另一個概念的出現有先后,則兩者之間的關系即為順序關系;
h)血緣關系,若一個概念和另一個概念有血親聯系,則兩者之間的關系即為血緣關系;
i)時間關系,若一個概念和另一個概念是時間上的聯系,則兩者之間的關系即為時間關系;
j)實例關系,若一個概念是另一個的實例化表示,則兩者之間的關系即為實例關系。
k)使能關系,若兩個概念之間有主動或者被動的支配關系,則兩者的關系即為使能關系。
5.如權利要求1所述的方法,其特征在于,所述置信度衡量常識的準確性,所述置信度根據常識的來源確定,越可靠的來源置信度值越大。
6.如權利要求1所述的方法,其特征在于,所述頻率是索引構建的依據,頻率初始設置為0,根據常識被檢索的頻次而動態增加,當達到一定的頻率閾值后,設置單獨的索引來提高檢索速度。
7.如權利要求6所述的方法,其特征在于,通過經驗設定所述頻率閾值。
8.一種基于超節點的常識語義圖譜構建裝置,其特征在于,包括:
超節點建立模塊,負責建立超節點,所述超節點代表一個概念或者實體,由一組同義詞集合來表示;
語義關系建立模塊,負責建立語義關系,所述語義關系表示概念或實體之間的關聯關系;
屬性設置模塊,負責設置常識的屬性,所述屬性包括常識的置信度和常識檢索的頻率;
圖譜建立模塊,負責由所述超節點、所述語義關系和所述屬性構成常識語義圖譜,所述超節點之間以語義關系為邊來連接,所述屬性附屬在所述邊上。
9.一種基于連接預測的常識補全方法,其特征在于,包括以下步驟:
a)由采用權利要求1至7中任一權利要求所述方法建立的常識圖譜構成常識庫,常識庫的檢索接口增加日志功能,記錄每次檢索未召回的概念;
b)以所述未召回的概念為頭節點,利用推理模型在不同關系中進行預測,得到尾節點,或者以所述未召回的概念為尾節點,利用推理模型在不同關系中進行預測,得到頭結點,取得分最高的為預測結果;
c)每隔一個固定周期進行批量推理預測,再批量地更新常識,從而不斷地補充新常識,完善常識庫。
10.如權利要求9所述的方法,其特征在于,所述推理模型采用語義嵌入模型,對常識知識進行向量化表示,所述向量化表示采用低緯稠密向量,在保留語義信息的同時方便進行語義計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810320164.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于多尺度區域特征比對的商標圖像檢索方法
- 下一篇:菜譜推薦的方法和裝置





