[發(fā)明專利]一種基于多任務(wù)學(xué)習(xí)的腸癌診斷電子病歷屬性值抽取方法有效
| 申請?zhí)枺?/td> | 202010429765.2 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111666762B | 公開(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計)人: | 杜明;周軍鋒;徐波;劉國華;左彥飛;龐敏敏;張弘;王文坤;王璿 | 申請(專利權(quán))人: | 東華大學(xué) |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/211;G16H10/60;G06N20/20;G06N3/0442;G06N3/045 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 徐俊 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 任務(wù) 學(xué)習(xí) 腸癌 診斷 電子 病歷 屬性 抽取 方法 | ||
本發(fā)明公開了基于多任務(wù)學(xué)習(xí)的腸癌診斷電子病歷屬性值抽取方法,具體為一種端到端的神經(jīng)網(wǎng)絡(luò)模型從文本的多個實例中提取屬性值。首先,對于每個實例使用預(yù)訓(xùn)練的詞嵌入來更好地初始化神經(jīng)網(wǎng)絡(luò)模型中的參數(shù)。其次,使用領(lǐng)域語料庫(訓(xùn)練數(shù)據(jù))對其進(jìn)行微調(diào)來捕獲特定領(lǐng)域的語義/知識。然后,使用BiLSTM層來考慮多條句子上下文信息,以獲得更好的句子表示。接著,考慮到并非所有句子對每一個屬性提取器都有用,本發(fā)明使用注意力機(jī)制為不同的屬性提取器選擇最重要的實例,并相應(yīng)地減少其它實例所帶來的噪聲。最后,在輸出層使用多任務(wù)學(xué)習(xí)機(jī)制,共同學(xué)習(xí)相關(guān)任務(wù)以同時解決多個多類問題任務(wù),從而獲得更好的結(jié)果并減少過擬合的風(fēng)險。同時,還對每個任務(wù)的損失貢獻(xiàn)做出了不同重要性的區(qū)分。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于多任務(wù)學(xué)習(xí)的腸癌診斷電子病歷屬性值抽取方法,特別是針對腸癌電子病歷進(jìn)行屬性值抽取,完成后結(jié)構(gòu)化任務(wù),屬于信息技術(shù)領(lǐng)域。
背景技術(shù)
伴隨著信息技術(shù)的迅速發(fā)展,給醫(yī)院的信息化建設(shè)帶來了技術(shù)支持,使得許多醫(yī)院已經(jīng)著手于醫(yī)院信息系統(tǒng)(hospital?Information?System,HIS)的建設(shè)。我國人口眾多,每個時間點都發(fā)生著不同大小的醫(yī)療事件,由此產(chǎn)生了海量的醫(yī)療數(shù)據(jù)。其中,電子病歷(EMR)數(shù)據(jù)中蘊(yùn)含著大量患者的疾病信息和醫(yī)療知識,受到了科研工作者的廣泛關(guān)注。
電子病歷(EMR)數(shù)據(jù)是患者就診過程中產(chǎn)生并被記錄的臨床資源,主要是由醫(yī)生、護(hù)士等醫(yī)療工作人員通過填寫醫(yī)院信息系統(tǒng)表單而產(chǎn)生的文字、圖形、圖表、符號等數(shù)字化信息。電子病歷系統(tǒng)相較于傳統(tǒng)的紙質(zhì)病歷,它有效地提高了醫(yī)生的工作質(zhì)量和工作效率,減少了醫(yī)療錯誤,降低了醫(yī)療成本,規(guī)范了醫(yī)療行為和過程管理。但是,海量的電子病歷數(shù)據(jù)是醫(yī)學(xué)領(lǐng)域的寶貴財富,目前僅是將這些信息存儲和管理起來,沒有進(jìn)行有效地分析和挖掘其潛在的醫(yī)學(xué)用途,不能為臨床醫(yī)療決策提供支持。
伴隨著計算機(jī)硬件、大數(shù)據(jù)和人工智能的發(fā)展,計算機(jī)算法被不斷提出和更新,已經(jīng)能夠精準(zhǔn)的從海量數(shù)據(jù)中挖掘出其潛在的有價值的信息,從而幫助提升醫(yī)院的整體醫(yī)療質(zhì)量,加快醫(yī)院信息化建設(shè)的步伐。但是,想要充分利用電子病歷中的寶貴信息就必須先將其非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行抽取成結(jié)構(gòu)化數(shù)據(jù),例如醫(yī)生對患者病情的描述信息、醫(yī)生給患者提供的治療方案、用藥記錄等等。其中,數(shù)據(jù)挖掘和信息處理的最有效的手段是自然語言處理中文本分類和序列標(biāo)注方法。我們需要充分利用這些方法,將電子病歷數(shù)據(jù)中有效的信息抽取出來,幫助醫(yī)療科研人員進(jìn)行二次利用,降低科研人員的工作難度和復(fù)雜程度,提高數(shù)據(jù)挖掘的效率和質(zhì)量,推進(jìn)醫(yī)學(xué)領(lǐng)域的信息化建設(shè)。同時,對電子病歷數(shù)據(jù)進(jìn)行分析挖掘,發(fā)現(xiàn)病歷潛在的醫(yī)學(xué)知識,對疾病做出準(zhǔn)確地趨勢分析。
近年來,由于自然語言處理(Natural?Language?Processing,NLP)和深度學(xué)習(xí)(Deep?Learning)擁有自動提取特征、構(gòu)建復(fù)雜模型以及處理圖像的能力,具有良好的泛化能力,被廣泛地應(yīng)用在各個領(lǐng)域中。這種自動提取特征的能力,非常適合用于處理醫(yī)學(xué)數(shù)據(jù)分析所面臨的問題,引起了醫(yī)學(xué)領(lǐng)域研究者的思考,如何有效地將這些技術(shù)應(yīng)用在電子病歷數(shù)據(jù)的挖掘中。電子病歷數(shù)據(jù)里面包含了患者從入院到出院的所有信息,包括患者的基本信息、住院時間、病情描述、手術(shù)記錄、用藥記錄、出院時間等。如果通過自然語言處理技術(shù)將這些信息進(jìn)行有效地利用,那么對于整個醫(yī)院的信息化建設(shè)會有很大的提升。其中,文本數(shù)據(jù)是電子病歷中最重要的部分之一,處理好文本數(shù)據(jù)是要想有效的利用電子病歷中的寶貴信息的必然選擇。因此,電子病歷后結(jié)構(gòu)化的研究成為了挖掘電子病歷潛在信息的前提。
面對目前這種現(xiàn)狀,學(xué)者們進(jìn)行了多次嘗試,提出了多種解決辦法。目前為止,對電子病歷進(jìn)行后結(jié)構(gòu)化操作存在兩種方法,分別是結(jié)構(gòu)化數(shù)據(jù)輸入(Structured?DataEntry,SDE)和自然語言處理(Natural?Language?Processing,NLP)[1]。下面介紹五種目前國內(nèi)外正在使用或研究中的電子病歷后結(jié)構(gòu)化方法[2]。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東華大學(xué),未經(jīng)東華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010429765.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種粉利切斷設(shè)備
- 下一篇:一種容器抓手
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計算機(jī)可讀介質(zhì)
- 一種自動分配和推送的任務(wù)管理平臺及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲介質(zhì)
- 基于會話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 一種人類結(jié)腸癌細(xì)胞系DXH-1及其應(yīng)用
- 整合素β4在制備區(qū)分結(jié)腸癌和直腸癌試劑或藥中的應(yīng)用
- PADI3在診斷和/或治療結(jié)腸癌中的應(yīng)用
- 木蘭脂素在抗結(jié)直腸癌中的應(yīng)用
- 結(jié)直腸癌醫(yī)療數(shù)據(jù)處理方法及裝置、存儲介質(zhì)、電子設(shè)備
- SPZ1的用途及其抑制劑的用途、藥物組合物和藥物篩選方法
- 人DDX10基因的用途及相關(guān)產(chǎn)品
- 人NUFIP1的用途及相關(guān)產(chǎn)品
- 一種與結(jié)直腸癌相關(guān)的miRNA及其應(yīng)用
- 結(jié)腸癌腫瘤特異TCR序列及其應(yīng)用





