[發(fā)明專利]一種基于雙鄰域圖神經(jīng)網(wǎng)絡(luò)的醫(yī)療實(shí)體對(duì)齊方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110709149.7 | 申請(qǐng)日: | 2021-06-25 |
| 公開(公告)號(hào): | CN113361279B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 史新晨;章永龍;李斌 | 申請(qǐng)(專利權(quán))人: | 揚(yáng)州大學(xué) |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F40/30;G06N3/048;G06N3/084;G06N3/0985;G06F16/335;G06F16/35;G06F16/36;G16H50/70 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 孟紅梅 |
| 地址: | 225009 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 鄰域 神經(jīng)網(wǎng)絡(luò) 醫(yī)療 實(shí)體 對(duì)齊 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于雙鄰域圖神經(jīng)網(wǎng)絡(luò)的醫(yī)療實(shí)體對(duì)齊方法及系統(tǒng),屬于自然語言處理中的知識(shí)圖譜融合領(lǐng)域。本發(fā)明首先抽取醫(yī)療實(shí)體對(duì)及相應(yīng)的關(guān)系和屬性,預(yù)處理后構(gòu)建實(shí)體對(duì)齊數(shù)據(jù)集;然后通過雙鄰域特征聚合生成實(shí)體鄰域和屬性鄰域的節(jié)點(diǎn)特征,并通過串聯(lián)操作和跳躍連接生成全局感知的實(shí)體表示;最后進(jìn)行實(shí)體相似度計(jì)算與訓(xùn)練,并用訓(xùn)練完的模型預(yù)測(cè)源實(shí)體的目標(biāo)實(shí)體。本發(fā)明提出的方法將醫(yī)療知識(shí)圖譜中的相關(guān)屬性視為一類特殊的節(jié)點(diǎn),從而將實(shí)體和屬性建模在統(tǒng)一的網(wǎng)絡(luò)中,并使用雙鄰域圖神經(jīng)網(wǎng)絡(luò)對(duì)圖中的節(jié)點(diǎn)進(jìn)行嵌入,這樣可以同時(shí)捕獲實(shí)體鄰域和屬性鄰域中的結(jié)構(gòu)相似性,最終生成語義豐富的實(shí)體表示,達(dá)到提高醫(yī)療實(shí)體對(duì)齊準(zhǔn)確性的目的。
技術(shù)領(lǐng)域
本發(fā)明屬于自然語言處理中的知識(shí)圖譜融合領(lǐng)域,特別涉及一種基于雙鄰域圖神經(jīng)網(wǎng)絡(luò)的醫(yī)療實(shí)體對(duì)齊方法及系統(tǒng)。
背景技術(shù)
隨著數(shù)據(jù)挖掘的繁榮發(fā)展,眾多領(lǐng)域都產(chǎn)生了相應(yīng)的知識(shí)圖譜。在醫(yī)療領(lǐng)域,醫(yī)療知識(shí)圖譜中知識(shí)來源的多樣性導(dǎo)致了知識(shí)重復(fù)、知識(shí)質(zhì)量良莠不齊、知識(shí)間關(guān)聯(lián)不夠明確等問題。例如阿奇霉素在百度百科中被稱為希舒美,在A+醫(yī)學(xué)百科中別名有阿齊霉素、阿奇紅霉素、疊氮紅霉素等,商品名有泰力特、希舒美、舒美特等。實(shí)體對(duì)齊可以自動(dòng)識(shí)別不同醫(yī)療知識(shí)圖譜中的等價(jià)實(shí)體,是醫(yī)學(xué)知識(shí)融合中非常重要的一步。
目前,基于嵌入的實(shí)體對(duì)齊是實(shí)體對(duì)齊任務(wù)中的主流方法,它的關(guān)鍵思想是將知識(shí)圖譜中的元素(如實(shí)體和關(guān)系)表示為低維向量(稱為嵌入),使得實(shí)體的語義相關(guān)性被嵌入空間的幾何結(jié)構(gòu)捕獲。根據(jù)嵌入模型的不同,基于嵌入的實(shí)體對(duì)齊可以分為兩大類,即基于翻譯的實(shí)體對(duì)齊和基于圖神經(jīng)網(wǎng)絡(luò)的實(shí)體對(duì)齊。第一類方法使用TransE及其變體建模知識(shí)圖譜的結(jié)構(gòu),它們將關(guān)系解釋為從其頭部實(shí)體到其尾部實(shí)體的翻譯。第二類方法使用圖神經(jīng)網(wǎng)絡(luò)對(duì)知識(shí)圖譜進(jìn)行嵌入,因?yàn)閳D神經(jīng)網(wǎng)絡(luò)對(duì)于建模圖結(jié)構(gòu)的數(shù)據(jù)有很好的效果。此外,除了關(guān)系三元組,還有一些方法引入實(shí)體屬性、文本描述等了額外的信息來提高實(shí)體對(duì)齊的結(jié)果。但是現(xiàn)有的方法對(duì)于屬性三元組的利用仍然存在兩個(gè)缺陷。首先,這些方法都是在分開的網(wǎng)絡(luò)中建模關(guān)系三元組和屬性三元組,來自實(shí)體鄰域和屬性鄰域的對(duì)齊信號(hào)僅僅被保留在他們自身的網(wǎng)絡(luò)之中,而不能跨網(wǎng)絡(luò)進(jìn)行傳播。其次,有些方法使用了預(yù)訓(xùn)練的詞向量或者機(jī)器翻譯等外部工具,這不僅使得最終的實(shí)體對(duì)齊結(jié)果依賴于工具本身的質(zhì)量,還會(huì)增加模型的復(fù)雜度和訓(xùn)練開銷。
發(fā)明內(nèi)容
發(fā)明目的:針對(duì)上述現(xiàn)有方法存在的技術(shù)問題,本發(fā)明的目的在于提供一種基于雙鄰域圖神經(jīng)網(wǎng)絡(luò)的醫(yī)療實(shí)體對(duì)齊方法及系統(tǒng),能夠有效利用屬性信息,生成語義更加豐富的實(shí)體表示,并具有參數(shù)少、訓(xùn)練開銷小、對(duì)齊結(jié)果準(zhǔn)確性高等特點(diǎn)。
技術(shù)方案:為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為:
一種基于雙鄰域圖神經(jīng)網(wǎng)絡(luò)的醫(yī)療實(shí)體對(duì)齊方法,包括以下步驟:
步驟1,從鏈接開放數(shù)據(jù)項(xiàng)目所存儲(chǔ)的醫(yī)療知識(shí)圖譜中,抽取醫(yī)療領(lǐng)域?qū)R的實(shí)體對(duì)以及相應(yīng)的關(guān)系和屬性,并對(duì)得到的數(shù)據(jù)進(jìn)行預(yù)處理;
步驟2,將實(shí)體和屬性建模在統(tǒng)一的網(wǎng)絡(luò)中,通過關(guān)系三元組定義實(shí)體和實(shí)體之間的拓?fù)溥B接,屬性三元組定義實(shí)體和屬性之間的拓?fù)溥B接,使用圖神經(jīng)網(wǎng)絡(luò)分別在實(shí)體鄰域和屬性鄰域進(jìn)行特征聚合,生成實(shí)體鄰域特征和屬性鄰域特征,并使用門控機(jī)制進(jìn)行特征整合以保持實(shí)體嵌入的維度不變;
步驟3,通過串聯(lián)操作得到每一層的雙鄰域特征,并通過跳躍連接輸出,生成全局感知的實(shí)體表示;
步驟4,根據(jù)兩個(gè)實(shí)體在嵌入空間的距離計(jì)算相似度,對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并用訓(xùn)練完的模型預(yù)測(cè)源實(shí)體的目標(biāo)實(shí)體。
進(jìn)一步地,步驟1中具體過程包括:
步驟1-1,隨機(jī)抽取不同醫(yī)療知識(shí)圖譜中對(duì)齊的醫(yī)療實(shí)體對(duì);
步驟1-2,抽取步驟1-1獲得的實(shí)體的關(guān)系和屬性信息,以關(guān)系三元組和屬性三元組的方式存儲(chǔ);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于揚(yáng)州大學(xué),未經(jīng)揚(yáng)州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110709149.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





