[發明專利]基于機器學習的中文RCT智能分類器的構建方法在審
| 申請號: | 201811525748.8 | 申請日: | 2018-12-13 |
| 公開(公告)號: | CN109753564A | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 李春潔;姚攀;陳圣愷;謝雨;毛渤淳;臧義;曹鈺彬;于中華;陳黎;劉露;徐楊 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G16H50/70 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 韓雪 |
| 地址: | 610041 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構建 分類器模型 基于機器 智能分類 訓練集 驗證集 標注 中文 構建分類器 參數調整 分類結果 人工分類 神經網絡 循證醫學 主觀因素 自動學習 分類 學習 | ||
本發明公開了一種基于機器學習的中文RCT智能分類器的構建方法,包括以下步驟:S1:對海量文獻進行標注分類的步驟;S2:挑選出標注的文獻構建訓練集、驗證集的步驟;S3:對訓練集采用神經網絡進行深度學習以構建分類器模型的步驟;S4:基于驗證集對分類器模型進行參數調整的步驟。本發明所構建出的分類器模型,可大幅縮短中文文獻在循證醫學領域的分類時間,同時克服人工分類主觀因素的影響,是分類結果更加準確和客觀,具備快速、準確、客觀、全自動、準確性高、自動學習的特點。
技術領域
本發明涉及循證醫學領域,尤其是一種基于機器學習的中文RCT智能分類器的構建方法。
背景技術
隨著醫學理念的發展,當前的醫療模式已從過去的經驗醫學向循證醫學(Evidence based medicine,EBM)轉變。秉持“一切臨床決策均應由臨床證據出發”的循證醫學能為醫學臨床工作提供最有力的證據支持和嚴謹的臨床科研設計指導,對臨床實踐與科研有重要指導意義。
循證醫學的主要證據載體為系統評價,其撰寫要求極其嚴格,研究者需要針對某一明確臨床問題進行系統性檢索和文獻篩選找出當前最佳臨床證據,并對這些證據進行偏倚風險評價和結果整合。其步驟涉及系統檢索、文獻篩選、信息提取、偏倚風險評價和數據合成等。
為了控制納入文獻本身的偏倚風險,系統評價撰寫者需要尋找的當前最佳臨床證據一般為研究設計最為嚴謹的隨機對照臨床試驗(Randomized Controlled ClinicalTrial,RCT)。且為保證檢索的系統性,評價者多采用查全率(靈敏度)極高但查準率(準確度)很低的檢索策略,使得文獻篩選環節常要面對上千條標題摘要構成的題錄,且絕大多數題錄并非RCT,這將花費研究者大量的時間和精力,同時導致系統評價的撰寫和更新速度遠不能滿足臨床決策的需求。一項研究顯示,評價一篇系統評價平均需篩選1781篇文獻,而無關文獻平均篩除率達97.1%,發表一篇系統評價平均需要64.3周。而可以說,系統評價的撰寫和更新速度一定程度上決定了臨床決策的進步速度,決定了人類醫學的發展速度。
盡管文獻篩選工作本身要求嚴格、流程復雜、工作量大,但是目前尚沒有專門為之開發的智能分類器。主流文獻管理軟件并非為循證醫學專門開發,其用于文獻標注、核對的過程仍有大量重復機械的勞動需要研究者手動完成。
近年來自然語言處理技術(Natural Language Processing,NLP)飛速發展,融合了深度學習算法后的自然語言處理技術也逐漸進入醫學文獻處理領域。針對英文RCT文獻分類器的研究已有先例,但中文醫學文獻處理領域,目前還處于空白狀態。而在自然語言處理領域,英文與中文存在著極大的不同。因此,開發一套能夠通過文獻內容自動判斷該中文研究是否為RCT的智能識別算法用于輔助研究者進行文獻篩,選將大大減少系統評價的工作量,提高撰寫效率,最終加快臨床證據的總結與更新。
發明內容
本發明的發明目的在于:針對上述存在的問題,提供一種利用機器學習的方法,構建出可快速、準確地對中文文獻以循證醫學的角度進行自動分類的分類器模型。
本發明采用的技術方案如下:
一種基于機器學習的中文RCT智能分類器的構建方法,包括以下步驟:
S1:對海量文獻進行標注分類的步驟;
S2:挑選出標注的文獻構建訓練集、驗證集的步驟;
S3:對訓練集采用神經網絡進行深度學習以構建分類器模型的步驟;
S4:基于驗證集對分類器模型進行參數調整的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811525748.8/2.html,轉載請聲明來源鉆瓜專利網。





