[發明專利]一種淋巴瘤病理類型的智能分類系統和方法在審
| 申請號: | 201710112852.3 | 申請日: | 2017-02-28 |
| 公開(公告)號: | CN106951917A | 公開(公告)日: | 2017-07-14 |
| 發明(設計)人: | 張洋;高彥回;劉為 | 申請(專利權)人: | 思派(北京)網絡科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F19/00 |
| 代理公司: | 北京天達知識產權代理事務所(普通合伙)11386 | 代理人: | 張春,龔頤雯 |
| 地址: | 100082 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 淋巴瘤 病理 類型 智能 分類 系統 方法 | ||
技術領域
本發明涉及機器學習的技術領域,尤其涉及一種淋巴瘤病理類型的智能分類系統和方法。
背景技術
目前,正處于大數據時代,到處都有大規模數據量的數據,現有技術中的簡單規則處理難以發揮這些數據的價值。硬件的高速發展給大數據的應用提供了條件。高性能計算使得基于大規模數據的數據學習時間和數據處理代價大大降低了;大規模數據存儲,使得能夠更快、代價更小地處理大規模數據。由于硬件和算法的發展,使得在使用機器學習解決數據分析的問題后,能獲得更加豐厚收益。
現有的機器學習技術主要運用到新聞、電子商務等互聯網領域,在傳統領域,尤其是醫學領域的應用十分匱乏。因此,本發明提供一種將機器學習方法運用到醫學領域中,進行淋巴瘤病理類型的智能分類方法,以彌補現有技術中,淋巴瘤的分類主要依賴醫生的主觀判斷,判斷的準確性取決于醫生的工作經驗,不同的醫生對患者病情的判斷結果可能回不一致,這容易導致誤診,甚至可能會延誤患者病情的問題。
發明內容
鑒于上述的分析,本發明旨在提供一種淋巴瘤病理類型的智能分類系統和方法,用以解決耗費人力、依賴醫生主觀判斷的問題。
本發明的目的主要是通過以下技術方案實現的:
一種淋巴瘤病理類型的智能分類系統,其特征在于,包括醫生工作站和服務器,
醫生工作站用于接收輸入信息和顯示分類結果;
服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、淋巴瘤病理分類器;
信息獲取模塊獲取診斷為淋巴瘤的病例的電子數據,從中獲得訓練集合;
預處理模塊提取訓練集合中的每個病例的特征病理信息,將提取的特征病理信息逐個與預先判定的淋巴瘤分類結果對應;再對提取的病理信息進行預處理,生成訓練用特征詞集合,并為集合中的特征詞生成對應的特征數值,將特征數值輸入到模型訓練模塊;預處理模塊還用于對用戶輸入信息進行特征病理信息提取、預處理和生成特征數值,并將該特征數值輸入到經過訓練的淋巴瘤病理分類器;
模型訓練模塊利用特征數值,訓練分類分析模型,得到經過訓練的淋巴瘤病理分類器;
信息接收模塊接收用戶通過醫生工作站輸入的信息,并將接收的信息傳輸到預處理模塊;
經過訓練的淋巴瘤病理分類器根據預處理模塊處理用戶輸入信息得到的特征數值,得出淋巴瘤病理類型分類結果,并輸出到醫生工作站。
所述預處理模塊提取的特征病理信息包括:淋巴腫瘤的病理名稱、病理描述、病理歸屬分類。
所述預處理模塊中的預處理包括:對提取的病理信息中的每條信息進行分詞,獲得文本詞集;以及對分詞結果進行噪聲詞剔除處理。
在噪聲詞剔除處理之后,還包括對特征詞集合中的同義詞進行替換。
優選的,噪聲詞剔除處理是通過建立噪聲詞表的方式進行匹配和剔除。
所述預處理模塊還包括對訓練用特征詞集合中的特征詞進行特征選擇;以及采用Hash算法為訓練用特征詞集合中的特征詞生成對應的特征數值。
所述分類分析模型基于支持向量機算法。
進一步的,服務器還包括測試模塊,用于對經過訓練的淋巴瘤病理分類器進行測試;當測試結果不理想時,更改分類分析算法或更改特征選擇的數量,以對淋巴瘤病分類模型進行調整;基于重新獲得的淋巴瘤病分類模型,再由測試模塊對淋巴瘤病理分類器測試;通過不斷調整淋巴瘤病分類模型并進行測試,直到測試結果達標。
本發明還提供一種淋巴瘤病理類型的智能分類方法,包括以下步驟:
步驟S1.獲取診斷為淋巴瘤的病例的電子數據,從電子數據獲得訓練集合;
步驟S2.提取訓練集合中的每個病例的特征病理信息,將提取的特征病理信息逐個與預先判定的淋巴瘤分類結果對應;
步驟S3.對提取的病理信息進行預處理,生成訓練用特征詞集合;
步驟S4.為訓練用特征詞集合中的特征詞生成對應的特征數值;
步驟S5.利用上一步生成的特征數值,訓練分類分析模型,得到淋巴瘤病理分類器;
步驟S6.接收用戶輸入的、對病理的描述信息;
步驟S7.對輸入信息進行特征病理信息提取、預處理和生成特征數值的處理;
步驟S8.淋巴瘤病理分類器根據待分類信息的特征數值,得出用戶輸入信息的淋巴瘤病分類結果。
本發明有益效果如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思派(北京)網絡科技有限公司,未經思派(北京)網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710112852.3/2.html,轉載請聲明來源鉆瓜專利網。





