[發(fā)明專(zhuān)利]一種詞條的同義判別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010190072.2 | 申請(qǐng)日: | 2020-03-18 |
| 公開(kāi)(公告)號(hào): | CN111414750B | 公開(kāi)(公告)日: | 2023-08-18 |
| 發(fā)明(設(shè)計(jì))人: | 郭輝;徐偉建;史亞冰;羅雨;彭衛(wèi)華 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類(lèi)號(hào): | G06F40/247 | 分類(lèi)號(hào): | G06F40/247;G06F40/284;G06N3/0464;G06N3/08 |
| 代理公司: | 北京品源專(zhuān)利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 詞條 同義 判別 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)公開(kāi)了一種詞條的同義判別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),涉及知識(shí)圖譜技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:獲取待進(jìn)行同義判別的詞條對(duì)的特征信息;將所述詞條對(duì)的特征信息輸入至訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,得到所述詞條對(duì)的同義判別結(jié)果;本實(shí)施例直接將預(yù)訓(xùn)練層的結(jié)構(gòu)、參數(shù)和特征進(jìn)行知識(shí)遷移,采用預(yù)訓(xùn)練層對(duì)所述詞條對(duì)的特征信息進(jìn)行學(xué)習(xí),減少訓(xùn)練過(guò)程中的標(biāo)注量,節(jié)省大量的資源和人力進(jìn)一步提高同義判別效率,提高同義判別結(jié)果的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù),尤其涉及知識(shí)圖譜技術(shù)領(lǐng)域。
背景技術(shù)
有些行業(yè)中,描述行業(yè)內(nèi)實(shí)體的術(shù)語(yǔ)別名較多,口語(yǔ)化的描述也差別很大。例如醫(yī)療領(lǐng)域中,對(duì)于檢查、手術(shù)、臨床、藥物、疾病等的實(shí)體的標(biāo)準(zhǔn)名和別名較多,例如,感冒和上呼吸道感染描述的是同一疾病,妊高癥和妊娠期高血壓描述的是同一疾病。
在將智能項(xiàng)目落地時(shí),需要對(duì)同一實(shí)體的標(biāo)準(zhǔn)名和別名進(jìn)行統(tǒng)一,以便項(xiàng)目成功運(yùn)行。目前主要通過(guò)人工審核標(biāo)注的方式確認(rèn)詞條的同義關(guān)系,并將同義的詞條進(jìn)行統(tǒng)一。
通過(guò)人工審核標(biāo)注的方式需要大量的人力,耗時(shí)較長(zhǎng),也會(huì)影響有關(guān)智能項(xiàng)目落地。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種詞條的同義判別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),以提高詞條的判別效率,節(jié)省人力資源,以加快有關(guān)智能項(xiàng)目落地。
第一方面,本申請(qǐng)實(shí)施例提供了一種詞條的同義判別方法,包括:
獲取待進(jìn)行同義判別的詞條對(duì)的特征信息;
將所述詞條對(duì)的特征信息輸入至訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,得到所述詞條對(duì)的同義判別結(jié)果;
其中,所述神經(jīng)網(wǎng)絡(luò)模型包括預(yù)訓(xùn)練層、微調(diào)層和輸出層;所述預(yù)訓(xùn)練層預(yù)先采用自然語(yǔ)言訓(xùn)練樣本進(jìn)行語(yǔ)言理解任務(wù)的訓(xùn)練,用于對(duì)所述詞條對(duì)的特征信息進(jìn)行學(xué)習(xí),得到所述詞條對(duì)的語(yǔ)言理解信息;所述微調(diào)層用于對(duì)所述語(yǔ)言理解信息進(jìn)行特征提取和融合,得到所述詞條對(duì)是否同義的特征表示;所述輸出層用于根據(jù)所述特征表示得到所述同義判別結(jié)果。
本申請(qǐng)實(shí)施例通過(guò)將詞條對(duì)的特征信息輸入至訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,進(jìn)行同義判別,從而在特征層面,結(jié)合神經(jīng)網(wǎng)絡(luò)模型的深度學(xué)習(xí)功能進(jìn)行同義判別,能夠提高同義判別的效率,節(jié)省人力資源,以加快有關(guān)智能項(xiàng)目落地;本實(shí)施例中,預(yù)訓(xùn)練層是預(yù)先采用自然語(yǔ)言訓(xùn)練樣本進(jìn)行語(yǔ)言理解任務(wù)的訓(xùn)練得到的,自然語(yǔ)言訓(xùn)練樣本與詞條對(duì)具有相同的特征分布,則直接將預(yù)訓(xùn)練層的結(jié)構(gòu)、參數(shù)和特征進(jìn)行知識(shí)遷移,采用預(yù)訓(xùn)練層對(duì)所述詞條對(duì)的特征信息進(jìn)行學(xué)習(xí),減少訓(xùn)練過(guò)程中的標(biāo)注量,節(jié)省大量的資源和人力進(jìn)一步提高同義判別效率;采用語(yǔ)言理解信息能夠精準(zhǔn)反映詞條對(duì)是否同義,則通過(guò)微調(diào)層對(duì)語(yǔ)言理解信息進(jìn)行特征提取和融合,得到所述詞條對(duì)是否同義的精準(zhǔn)的特征表示,進(jìn)一步通過(guò)輸出層根據(jù)精準(zhǔn)的特征表示得到所述同義判別結(jié)果,提高同義判別結(jié)果的準(zhǔn)確性。
可選的,預(yù)訓(xùn)練層為多重語(yǔ)言理解任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述多重語(yǔ)言理解任務(wù)包括詞法級(jí)別的任務(wù)、語(yǔ)法級(jí)別的任務(wù)和語(yǔ)義級(jí)別的任務(wù),所述語(yǔ)言理解信息包括詞法信息、語(yǔ)法信息和語(yǔ)義信息。
上述申請(qǐng)中的一種可選實(shí)施方式,預(yù)訓(xùn)練層從詞法、語(yǔ)法和語(yǔ)義3個(gè)層面更好的理解詞條對(duì)中蘊(yùn)含的信息,極大地增強(qiáng)了通用語(yǔ)義表示能力,從而通過(guò)神經(jīng)網(wǎng)絡(luò)模型得到更準(zhǔn)確的同義判別結(jié)果。
可選的,所述微調(diào)層包括:卷積層、池化層和全連接層;
所述卷積層用于對(duì)所述語(yǔ)言理解信息進(jìn)行特征提取,所述池化層用于對(duì)提取的特征進(jìn)行降維,所述全連接層用于對(duì)降維后的特征進(jìn)行融合,得到所述詞條對(duì)是否同義的特征表示。
上述申請(qǐng)中的一種可選實(shí)施方式,通過(guò)卷積層、池化層和全連接層實(shí)現(xiàn)微調(diào)層的特征提取和融合功能,實(shí)現(xiàn)方式簡(jiǎn)單、有效。在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí),可以通過(guò)調(diào)整卷積層、池化層和全連接層的參數(shù)靈活地提取不同的特征,對(duì)特征進(jìn)行不同維度的融合,從而對(duì)各領(lǐng)域各類(lèi)型的詞條對(duì)均能準(zhǔn)確地得到是否同義的特征表示。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010190072.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 創(chuàng)建詞條的方法及創(chuàng)建詞條的裝置
- 內(nèi)置詞條的顯示方法及顯示系統(tǒng)
- 用于展示候選詞條的方法和裝置
- 一種詞條轉(zhuǎn)化方法及裝置
- 操控句式生成、應(yīng)用操控方法及裝置、存儲(chǔ)介質(zhì)
- 詞條處理方法、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種詞條權(quán)重計(jì)算模型訓(xùn)練方法及裝置
- 一種基于區(qū)塊鏈的百科詞條管理系統(tǒng)和實(shí)施方法
- 目標(biāo)概念圖譜的構(gòu)建方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種待翻譯詞條的更新方法、裝置、設(shè)備和介質(zhì)
- 判別設(shè)備、判別方法和計(jì)算機(jī)程序
- 物體檢測(cè)裝置以及物體檢測(cè)方法
- 圖像處理裝置以及圖像處理方法
- 模擬傳感器的種類(lèi)判別裝置
- 一種水電站砂層土質(zhì)液化評(píng)判方法
- 基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定性自動(dòng)判別系統(tǒng)
- 一種基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定位自動(dòng)判別系統(tǒng)
- 一種活體人臉的判別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 糖網(wǎng)病眼底圖像的樣本數(shù)據(jù)標(biāo)注系統(tǒng)
- 一種循環(huán)漸進(jìn)式局部放電判別方法
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





