[發(fā)明專(zhuān)利]用于知識(shí)圖譜中節(jié)點(diǎn)和鏈接的多語(yǔ)言知識(shí)匹配方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010730143.3 | 申請(qǐng)日: | 2020-07-27 |
| 公開(kāi)(公告)號(hào): | CN111858961A | 公開(kāi)(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計(jì))人: | 李剛民;倪蘋(píng);李雨茗;白旭明 | 申請(qǐng)(專(zhuān)利權(quán))人: | 西交利物浦大學(xué) |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F16/35;G06F16/33;G06F40/295;G06F40/30;G06F40/284;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州謹(jǐn)和知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32295 | 代理人: | 葉棟 |
| 地址: | 215123 江蘇省蘇州市*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 知識(shí) 圖譜 節(jié)點(diǎn) 鏈接 語(yǔ)言 匹配 方法 裝置 | ||
本申請(qǐng)涉及一種用于知識(shí)圖譜中節(jié)點(diǎn)和鏈接的多語(yǔ)言知識(shí)匹配方法及裝置,屬于計(jì)算機(jī)技術(shù)領(lǐng)域,該方法包括:獲取目標(biāo)領(lǐng)域的多種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料;對(duì)于每種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料,將實(shí)體語(yǔ)料輸入與語(yǔ)言類(lèi)型對(duì)應(yīng)的分類(lèi)模型,得到實(shí)體語(yǔ)料對(duì)應(yīng)的科目分類(lèi);將實(shí)體語(yǔ)料輸入與語(yǔ)言類(lèi)型和科目分類(lèi)對(duì)應(yīng)的語(yǔ)言模型,得到實(shí)體語(yǔ)料對(duì)應(yīng)的語(yǔ)言識(shí)別結(jié)果;將多種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料對(duì)應(yīng)的語(yǔ)言識(shí)別結(jié)果輸入預(yù)先訓(xùn)練的孿生網(wǎng)絡(luò),將語(yǔ)言識(shí)別結(jié)果等價(jià)的不同語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料連接為一個(gè)整體;可以解決專(zhuān)用知識(shí)圖譜無(wú)法提供多語(yǔ)言知識(shí)的融合的問(wèn)題;從原始語(yǔ)料層級(jí)就進(jìn)行匹配,可以實(shí)現(xiàn)多語(yǔ)言知識(shí)圖譜的匹配,且可以收納上下文關(guān)聯(lián)信息從而提高匹配的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及一種用于知識(shí)圖譜匹配的多語(yǔ)言知識(shí)匹配方法及裝置,屬于計(jì)算機(jī)技術(shù)領(lǐng)域。
背景技術(shù)
知識(shí)圖譜的建立是把文本表述的知識(shí)以概念和關(guān)系結(jié)構(gòu)化,然后通過(guò)機(jī)器學(xué)習(xí)或者模型匹配的方式提取出來(lái),再以節(jié)點(diǎn)和鏈接表示成圖譜形式。
知識(shí)圖譜包括兩個(gè)方面:1、通用知識(shí)圖譜。這些知識(shí)庫(kù)限于通用知識(shí),由于語(yǔ)言的多義性等會(huì)引起一詞多義問(wèn)題,例如,關(guān)鍵字“發(fā)熱(fever)”被定義為一種臨床癥狀,而在維基百科中,fever還意味著一部波蘭電影、約翰·多恩的一首詩(shī)和一個(gè)虛構(gòu)的人物。這些意義不可能出現(xiàn)在醫(yī)學(xué)知識(shí)圖中,如果維基百科被用作直接的知識(shí)來(lái)源,會(huì)帶來(lái)一定的噪聲和語(yǔ)意曲解。2、專(zhuān)用知識(shí)圖譜。如金融知識(shí)圖譜、犯罪偵查知識(shí)圖譜和醫(yī)學(xué)知識(shí)圖譜等,這些知識(shí)圖譜聚焦更加集中和專(zhuān)業(yè)的特定知識(shí),并以專(zhuān)業(yè)知識(shí)庫(kù)為基礎(chǔ)。專(zhuān)業(yè)知識(shí)庫(kù)的準(zhǔn)確性高于通用知識(shí)庫(kù),但覆蓋面狹窄,而且往往是基于單一語(yǔ)言數(shù)據(jù)源,并且以單一語(yǔ)言為用戶(hù)服務(wù),因此用其他語(yǔ)言描述的一些知識(shí)無(wú)法融合和被利用。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N用于知識(shí)圖譜中節(jié)點(diǎn)和鏈接的多語(yǔ)言知識(shí)匹配方法及裝置,可以解決專(zhuān)用知識(shí)圖譜無(wú)法提供多語(yǔ)言知識(shí)的融合的問(wèn)題。本申請(qǐng)?zhí)峁┤缦录夹g(shù)方案:
第一方面,提供了一種用于知識(shí)圖譜中節(jié)點(diǎn)和鏈接的多語(yǔ)言知識(shí)匹配方法,所述方法包括:
獲取目標(biāo)領(lǐng)域的多種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料;
對(duì)于每種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料,將所述實(shí)體語(yǔ)料輸入與所述語(yǔ)言類(lèi)型對(duì)應(yīng)的分類(lèi)模型,得到所述實(shí)體語(yǔ)料對(duì)應(yīng)的科目分類(lèi),所述科目分類(lèi)屬于所述目標(biāo)領(lǐng)域;所述知識(shí)分類(lèi)模型基于循環(huán)卷積神經(jīng)網(wǎng)絡(luò)RCNN建立;
將所述實(shí)體語(yǔ)料輸入與所述語(yǔ)言類(lèi)型和所述科目分類(lèi)對(duì)應(yīng)的語(yǔ)言模型,得到所述實(shí)體語(yǔ)料對(duì)應(yīng)的語(yǔ)言識(shí)別結(jié)果;
將所述多種語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料對(duì)應(yīng)的語(yǔ)言識(shí)別結(jié)果輸入預(yù)先訓(xùn)練的孿生網(wǎng)絡(luò),將語(yǔ)言識(shí)別結(jié)果等價(jià)的不同語(yǔ)言類(lèi)型的實(shí)體語(yǔ)料連接為一個(gè)整體;所述孿生網(wǎng)絡(luò)包括每種語(yǔ)言類(lèi)型對(duì)應(yīng)的匹配網(wǎng)絡(luò)。
可選地,所述RCNN包括依次連接的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)層、最大池化max-pooling層和輸出層;
所述循環(huán)卷積神經(jīng)網(wǎng)絡(luò)層用于遞歸地計(jì)算所述待匹配語(yǔ)言數(shù)據(jù)中每個(gè)單詞的左上下文向量和右上下文向量;將所述左上下文向量、所述單詞的單詞向量和所述右上下文向量進(jìn)行拼接,得到所述單詞的向量表示;基于所述向量表示計(jì)算所述單詞的潛在語(yǔ)義向量;
所述max-pooling層用于獲取各個(gè)潛在語(yǔ)義向量中的最重要元素,得到所述待匹配語(yǔ)言數(shù)據(jù)的文本向量表示;
所述輸出層用于確定文本向量表示對(duì)應(yīng)的科目分類(lèi)。
可選地,所述右側(cè)上下文向量和所述左側(cè)上下文向量通過(guò)下式表示:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于西交利物浦大學(xué),未經(jīng)西交利物浦大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010730143.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 節(jié)點(diǎn)查詢(xún)方法、節(jié)點(diǎn)、移動(dòng)通訊系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品
- 一種根據(jù)節(jié)點(diǎn)集合構(gòu)造節(jié)點(diǎn)關(guān)系樹(shù)的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點(diǎn)劃分的方法
- 一種無(wú)線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點(diǎn)鎖定部件、節(jié)點(diǎn)滑軌、節(jié)點(diǎn)和機(jī)箱
- 一種待推薦節(jié)點(diǎn)線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點(diǎn)、節(jié)點(diǎn)及施主節(jié)點(diǎn)
- 節(jié)點(diǎn)布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機(jī)構(gòu)
- 節(jié)點(diǎn)掛載方法、裝置、網(wǎng)絡(luò)節(jié)點(diǎn)及存儲(chǔ)介質(zhì)





