[發明專利]關鍵信息提取方法、裝置、電子設備和存儲介質有效
| 申請號: | 202110148747.1 | 申請日: | 2021-02-03 |
| 公開(公告)號: | CN112784601B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 伍俊妍;邱凱鋒;余曉霞;何志超;任麗軍;劉鵬 | 申請(專利權)人: | 中山大學孫逸仙紀念醫院;潤澤安泰(北京)科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/35;G06N3/049;G06N3/048;G06N3/08;G06N3/045 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 510120 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵 信息 提取 方法 裝置 電子設備 存儲 介質 | ||
本發明提供一種關鍵信息提取方法、裝置、電子設備和存儲介質,其中方法包括:對待處理的醫學文獻進行分句,得到所述醫學文獻中的各個分句;將各個分句輸入至關鍵信息提取模型中,得到所述關鍵信息提取模型輸出的各個分句的關鍵信息分類結果;其中,所述關鍵信息提取模型用于提取任一分句中各個分詞的上下文語義向量,并基于所述任一分句中各個分詞的上下文語義向量,對所述任一分句進行關鍵信息分類;任一分詞的上下文語義向量是同時基于所述任一分詞的上文信息和下文信息提取得到的。本發明提供的關鍵信息提取方法、裝置、電子設備和存儲介質,提高了語義提取的準確性,進而提高了關鍵信息提取的準確性。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種關鍵信息提取方法、裝置、電子設備和存儲介質。
背景技術
近年來,循證醫學在輔助醫療決策和醫學研究的過程中得到了廣泛應用。當前的臨床醫療實踐已經進展為循證醫學模式,循證醫學是解決臨床問題的最佳方法。抓住循證醫學的核心就是不斷地發現問題和解決問題,以科學實踐獲得的證據作為依據和指導成為了現代醫學的新模式。其中,這些證據來自于嚴格的流行病學調查和統計學分析,為最新、最快、可信度最高的全球所共享的研究結論。而系統評價作為文獻證據金字塔的頂端,可以為臨床醫生提供最佳效應估計,并方便臨床決策。系統評價的研究步驟包括文獻檢索與篩選、數據提取、定量合并等關鍵環節。獲取當前診療的最佳證據,也就是提取目標文獻的特征信息與關鍵信息是上述環節中最耗費時間與精力的一環。而隨著醫學的發展,發表論文的數量越來越多,循證醫學面臨的挑戰也更大。
對于單篇文獻,主要的信息往往存在于一組重要的關鍵句中,這些關鍵句能將文中的主要信息(如研究對象、干預措施、療效等)鮮明的表示出來。正是基于這種認知,在信息檢索和信息抽取等領域中,識別與篩選文本中的關鍵句是特別重要的一個步驟,可以協助研究者提高科研效率,助力高質量系統評價的制作,使醫療相關人員在現有的最佳科學研究證據基礎上做出最優的醫療決策。其中,篩選關鍵句是根據一定的目的要求,通過計算機技術辨別并提取包含文中主要信息的句子。
然而,對于醫學文獻的關鍵信息抽取,現有技術中傳統的統計方法和詞袋模型等,不僅沒有考慮時序問題,還易忽略句子本身的內容,將文中包含主要內容的關鍵句排除;而基于循環神經網絡(Recurrent?Neural?Network,RNN)、長短時記憶網絡(Long?Short-TermMemory,LSTM)等的序列模型,雖然解決了時序問題,且一定程度上捕捉到上下文的信息,但其每次進行語義提取時,僅考慮一個方向,其無法捕捉到各個分詞真正意義上的上下文信息。而無法捉到真正意義上的上下文信息,對醫學文獻關鍵信息抽取的準確率有很大的影響,導致關鍵信息提取的準確性欠佳。
發明內容
本發明提供一種關鍵信息提取方法、裝置、電子設備和存儲介質,用以解決現有技術中關鍵信息提取的準確性欠佳的缺陷,提高關鍵信息提取的準確性。
本發明提供一種關鍵信息提取方法,包括:
對待處理的醫學文獻進行分句,得到所述醫學文獻中的各個分句;
將各個分句輸入至關鍵信息提取模型中,得到所述關鍵信息提取模型輸出的各個分句的關鍵信息分類結果;
其中,所述關鍵信息提取模型用于提取任一分句中各個分詞的上下文語義向量,并基于所述任一分句中各個分詞的上下文語義向量,對所述任一分句進行關鍵信息分類;任一分詞的上下文語義向量是同時基于所述任一分詞的上文信息和下文信息提取得到的。
根據本發明提供的一種關鍵信息提取方法,所述將各個分句輸入至關鍵信息提取模型中,得到所述關鍵信息提取模型輸出的各個分句的關鍵信息分類結果,具體包括:
將任一分句輸入至所述關鍵信息提取模型的輸入向量編碼層,得到所述輸入向量編碼層輸出的所述任一分句的輸入向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學孫逸仙紀念醫院;潤澤安泰(北京)科技有限公司,未經中山大學孫逸仙紀念醫院;潤澤安泰(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110148747.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙接觸面PTC過流保護元件
- 下一篇:一種高密封性防塵軸承套圈及其制備方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





