[發(fā)明專利]一種知識(shí)圖譜的構(gòu)建方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010002624.2 | 申請(qǐng)日: | 2020-01-02 |
| 公開(kāi)(公告)號(hào): | CN111177393B | 公開(kāi)(公告)日: | 2023-03-24 |
| 發(fā)明(設(shè)計(jì))人: | 胡盼盼;趙茜;胡浩;周玥;佟博;謝曉婷;廖鳳玲;余梓玲 | 申請(qǐng)(專利權(quán))人: | 廣東博智林機(jī)器人有限公司 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F16/36 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 528000 廣東省佛山市順德區(qū)北滘鎮(zhèn)順江*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 知識(shí) 圖譜 構(gòu)建 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開(kāi)實(shí)施例公開(kāi)了一種知識(shí)圖譜的構(gòu)建方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:將文案語(yǔ)料輸入至預(yù)先設(shè)計(jì)的序列標(biāo)注模型,以通過(guò)所述序列標(biāo)注模型識(shí)別所述文案語(yǔ)料中的各實(shí)體以及各實(shí)體的所屬類型;對(duì)所述文案語(yǔ)料中的各實(shí)體進(jìn)行兩兩配對(duì),生成至少一條實(shí)體關(guān)系特征信息,所述實(shí)體關(guān)系特征信息包括各實(shí)體的所屬類型;將所述實(shí)體關(guān)系特征信息輸入至預(yù)先訓(xùn)練好的文本分類模型,以通過(guò)所述文本分類模型確定目標(biāo)實(shí)體與其它實(shí)體之間的關(guān)系;基于所述目標(biāo)實(shí)體與其它實(shí)體之間的關(guān)系,以及各實(shí)體的所屬類型構(gòu)建知識(shí)圖譜。本公開(kāi)實(shí)施例的技術(shù)方案,實(shí)現(xiàn)了知識(shí)圖譜的構(gòu)建目的。
技術(shù)領(lǐng)域
本公開(kāi)實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種知識(shí)圖譜的構(gòu)建方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
“知識(shí)圖譜”的概念最早由谷歌公司在2012年提出,其是一種將知識(shí)用網(wǎng)絡(luò)關(guān)系圖來(lái)表示的技術(shù)。在知識(shí)圖譜中,存在“實(shí)體”和“邊”的概念,“實(shí)體”指現(xiàn)實(shí)世界中的某一事物或概念,比如人、地名、概念或者組織機(jī)構(gòu)等,“邊”指不同實(shí)體間的關(guān)系,比如“人”-“居住在”-“地名”,“人”-“工作在”-“組織機(jī)構(gòu)”等。
目前,知識(shí)圖譜可用于智能問(wèn)答、智能推薦或者自動(dòng)寫(xiě)作等場(chǎng)景,因此構(gòu)建各領(lǐng)域的知識(shí)圖譜意義重大。
發(fā)明內(nèi)容
本公開(kāi)實(shí)施例提供一種知識(shí)圖譜的構(gòu)建方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以實(shí)現(xiàn)知識(shí)圖譜的構(gòu)建。
第一方面,本公開(kāi)實(shí)施例提供了一種知識(shí)圖譜的構(gòu)建方法,該方法包括:
將文案語(yǔ)料輸入至預(yù)先設(shè)計(jì)的序列標(biāo)注模型,以通過(guò)所述序列標(biāo)注模型識(shí)別所述文案語(yǔ)料中的各實(shí)體以及各實(shí)體的所屬類型;
對(duì)所述文案語(yǔ)料中的各實(shí)體進(jìn)行兩兩配對(duì),生成至少一條實(shí)體關(guān)系特征信息,所述實(shí)體關(guān)系特征信息包括各實(shí)體的所屬類型;
將所述實(shí)體關(guān)系特征信息輸入至預(yù)先訓(xùn)練好的文本分類模型,以通過(guò)所述文本分類模型確定目標(biāo)實(shí)體與其它實(shí)體之間的關(guān)系;
基于所述目標(biāo)實(shí)體與其它實(shí)體之間的關(guān)系,以及各實(shí)體的所屬類型構(gòu)建知識(shí)圖譜。
進(jìn)一步的,所述序列標(biāo)注模型包括轉(zhuǎn)換編碼器和條件隨機(jī)場(chǎng)TransformerEncoder+CRF模型,所述文本分類模型包括長(zhǎng)短期記憶和自關(guān)注LSTM+self-attention模型。
進(jìn)一步的,所述Transformer Encoder+CRF模型基于預(yù)先標(biāo)注標(biāo)簽的訓(xùn)練樣本進(jìn)行訓(xùn)練獲得,所采用的標(biāo)注方式為BIEO標(biāo)注方式,標(biāo)注標(biāo)簽包括實(shí)體標(biāo)簽以及實(shí)體的所屬類型標(biāo)簽。
進(jìn)一步的,所述Transformer Encoder+CRF模型基于預(yù)先標(biāo)注的訓(xùn)練樣本進(jìn)行訓(xùn)練獲得,包括:
將各訓(xùn)練樣本轉(zhuǎn)換為詞向量的形式,得到各樣本向量;
將所述各樣本向量輸入網(wǎng)絡(luò)結(jié)構(gòu)Transformer Encoder,得到輸出矩陣P,其中,矩陣P的大小為n*k,其中k為標(biāo)注的標(biāo)簽數(shù)目,Pi,j表示第i個(gè)字被預(yù)測(cè)為第j個(gè)標(biāo)簽的分?jǐn)?shù);
在CRF層,基于所述輸出矩陣P、標(biāo)簽轉(zhuǎn)移矩陣的初始值確定預(yù)測(cè)標(biāo)簽序列Y’,并結(jié)合標(biāo)簽序列真值Y對(duì)所述標(biāo)簽轉(zhuǎn)移矩陣的初始值進(jìn)行優(yōu)化,將優(yōu)化后的標(biāo)簽轉(zhuǎn)移矩陣確定為模型參數(shù)。
進(jìn)一步的,所述將文案語(yǔ)料輸入至預(yù)先設(shè)計(jì)的序列標(biāo)注模型,以通過(guò)所述序列標(biāo)注模型識(shí)別所述文案語(yǔ)料中的各實(shí)體以及各實(shí)體的所屬類型,包括:
將文案語(yǔ)料轉(zhuǎn)換為詞向量的形式,得到文案語(yǔ)料向量;
將所述文案語(yǔ)料向量輸入至網(wǎng)絡(luò)結(jié)構(gòu)Transformer Encoder,得到預(yù)測(cè)矩陣q,qi,j表示第i個(gè)字被預(yù)測(cè)為第j個(gè)標(biāo)簽的分?jǐn)?shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東博智林機(jī)器人有限公司,未經(jīng)廣東博智林機(jī)器人有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010002624.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測(cè)模型構(gòu)建方法
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





