[發(fā)明專利]醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法及醫(yī)學(xué)診斷標(biāo)準(zhǔn)術(shù)語(yǔ)映射模型訓(xùn)練方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010159004.X | 申請(qǐng)日: | 2020-03-09 |
| 公開(kāi)(公告)號(hào): | CN111460091B | 公開(kāi)(公告)日: | 2023-10-27 |
| 發(fā)明(設(shè)計(jì))人: | 劉霄;趙鑫 | 申請(qǐng)(專利權(quán))人: | 杭州麥歌算法科技有限公司 |
| 主分類號(hào): | G06F18/214 | 分類號(hào): | G06F18/214;G06F18/21;G06F18/22;G06F16/36;G06F40/237;G06F40/289;G06N3/08;G16H10/60 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 諸佩艷 |
| 地址: | 310051 浙江省杭州市濱江*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 醫(yī)學(xué) 文本 數(shù)據(jù) 負(fù)樣例 采樣 方法 診斷 標(biāo)準(zhǔn) 術(shù)語(yǔ) 映射 模型 訓(xùn)練 | ||
1.一種基于相似度的醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法,其特征在于:其包括以下步驟:
S1.基于標(biāo)準(zhǔn)術(shù)語(yǔ)集和待映射文本集合生成正樣例集合;
S2.對(duì)于正樣例集合中的任意正樣例,基于相似度計(jì)算函數(shù)生成候選負(fù)樣例集合,該候選負(fù)樣例集合用于醫(yī)學(xué)診斷標(biāo)準(zhǔn)術(shù)語(yǔ)映射模型訓(xùn)練。
2.根據(jù)權(quán)利要求1所述的基于相似度的醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法,其特征在于:其包括以下步驟:
S1.對(duì)于標(biāo)準(zhǔn)術(shù)語(yǔ)集為S、待映射文本集合T,生成正樣例集合{pi=(xi,yi)},其中xi∈T,yi={yik|yik∈S},xi為待映射文本,yi={yik|yik∈S}為對(duì)應(yīng)的正確標(biāo)準(zhǔn)術(shù)語(yǔ)集合;
S2.對(duì)于任意正樣例pi=(xi,yi),基于相似度計(jì)算函數(shù)生成候選負(fù)樣例集合為與yi類似的錯(cuò)誤術(shù)語(yǔ)。
3.根據(jù)權(quán)利要求2所述的醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法,其特征在于:為相似度計(jì)算函數(shù),θ取0.5;所述的其中,包括編輯距離、基于tf-idf的余弦相似度、杰卡德相似系數(shù)文本差異三個(gè)參數(shù),βl使用10折交叉驗(yàn)證來(lái)確定。
4.根據(jù)權(quán)利要求1所述的基于相似度的醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法,其特征在于:其包括以下步驟:
S1.對(duì)于標(biāo)準(zhǔn)術(shù)語(yǔ)集為S、待映射文本集合T,先生成擴(kuò)展術(shù)語(yǔ)集合G={S,E},E為標(biāo)準(zhǔn)術(shù)語(yǔ)之間的從屬關(guān)系結(jié)合,再生成正樣例集合進(jìn)一步生成擴(kuò)展正樣例集{pik=(xi,yik,sik)},其中sik為(xi,yik)之間的相似度評(píng)級(jí),該相似度評(píng)級(jí)完全基于知識(shí)圖譜結(jié)構(gòu)sik=simg(yik,yil),sik=1/min(|eik|);
S2.對(duì)于任意正樣例pi=(xi,yi,si),基于相似度計(jì)算函數(shù)生成候選負(fù)樣例集合為與yi類似的錯(cuò)誤術(shù)語(yǔ)。
5.一種醫(yī)學(xué)診斷標(biāo)準(zhǔn)術(shù)語(yǔ)映射模型訓(xùn)練方法,其特征在于:其包括以下步驟:
1)基于原始醫(yī)學(xué)診斷數(shù)據(jù)得到待映射文本,進(jìn)而生成訓(xùn)練集Ptrain,驗(yàn)證集Peval,測(cè)試集Ptest;
2)基于標(biāo)準(zhǔn)術(shù)語(yǔ)集和待映射文本集合生成正樣例集合;
3)對(duì)于正樣例集合中的任意正樣例,基于相似度計(jì)算函數(shù)生成候選負(fù)樣例集合;
4)獲取正樣例集合的一個(gè)子集,對(duì)于其中的每個(gè)正樣例,從候選負(fù)樣例集合中抽取部分或全部負(fù)樣例生成訓(xùn)練數(shù)據(jù)集,將正樣例集合的子集與訓(xùn)練數(shù)據(jù)集合并后形成一個(gè)訓(xùn)練批次;
5)將訓(xùn)練批次帶入神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州麥歌算法科技有限公司,未經(jīng)杭州麥歌算法科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010159004.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢問(wèn)細(xì)化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢問(wèn)系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種實(shí)現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識(shí)別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 置信分類方法及置信機(jī)器
- 安全帶識(shí)別模型構(gòu)建方法及裝置
- 平衡化數(shù)據(jù)集生成方法和裝置以及分類方法和裝置
- 結(jié)節(jié)檢測(cè)及其模型訓(xùn)練的方法和裝置以及電子設(shè)備
- 負(fù)樣本篩選模型訓(xùn)練方法、數(shù)據(jù)篩選方法和數(shù)據(jù)匹配方法
- 一種識(shí)別法律文書(shū)案由的方法和裝置
- 醫(yī)學(xué)短文本數(shù)據(jù)負(fù)樣例采樣方法及醫(yī)學(xué)診斷標(biāo)準(zhǔn)術(shù)語(yǔ)映射模型訓(xùn)練方法
- 一種跨語(yǔ)種實(shí)體標(biāo)注方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種知識(shí)圖譜嵌入訓(xùn)練方法和相關(guān)裝置
- 視頻時(shí)空特征學(xué)習(xí)、抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





