[發明專利]一種基于LDA和遷移學習的宮頸細胞特征提取方法在審
| 申請號: | 201810993450.3 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109190641A | 公開(公告)日: | 2019-01-11 |
| 發明(設計)人: | 黃金杰;張婕;何瑾潔 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征集 宮頸細胞 特征提取 網絡模型 學習 遷移 數據集 降維處理 數據分類 大數據 準確率 涵蓋 保存 | ||
本發明公開了一種基于LDA和遷移學習的宮頸細胞特征提取方法,其特征在于:基于深度學習網絡模型的特征提取方法,首先利用大數據集訓練一個深度學習網絡模型并保存模型;然后利用遷移學習,把宮頸細胞數據集輸入到訓練好的深度學習網絡模型中,提取到原始特征集;最后利用LDA對原始特征集進行降維處理,得到最終的特征集,該特征集涵蓋了數據集的更多信息,提高了數據分類的準確率。
技術領域
本發明涉及特征提取,深度學習,遷移學習和數據降維,具體是一種利用遷移學習已經訓練好的深度學習網絡模型來提取特征的方法。
背景技術
隨著網絡知識組織、人工智能等學科的發展,圖像識別、語音識別等技術越來越受到廣泛的關注。識別技術就是要把一種研究對象,根據其某些特征進行識別并分類。可以認為,要實現對研究對象的識別與分類需要先提取研究對象的特征。然而,隨著實踐活動的擴大、深入和社會化的需要,人們不僅需要識別分類數很多的事物,而且被識別的對象內容也越來越復雜。特別是由于科學技術水平的提高,使得各種不同的研究對象“圖像化”或“數字化”,這對特征提取技術要求較高,需要提取到的特征既能涵蓋更多的原有數據信息,還要降低計算量,使運行時間減少。
現有特征提取技術都是人為地找出數據集之間不同的特征并分別提取,不僅涵蓋的原始信息少,而且每一種特征都要人為地發現并計算出來,主觀性強,利用這種方法提取的特征集在識別中的準確率不是很高;基于深度學習網絡模型的特征提取方法是利用機器學習數據集的特征,該特征集涵蓋的原始信息多,更加精簡且表達能力更強,可以提高宮頸細胞圖像識別率。
發明內容
本發明的目的在于提供一種基于LDA和遷移學習的宮頸細胞特征提取方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種基于LDA和遷移學習的宮頸細胞特征提取方法,包括以下步驟:
(1)、訓練深度學習網絡模型:用現有的大數據集先訓練深度學習網絡模型,并保存模型;
(2)、利用遷移學習提取特征:遷移學習保存的模型,輸入宮頸細胞數據集,并提取特征;
(3)、LDA對原始特征集進行降維:利用LDA對原始特征集進行降維處理,使特征集更加精簡,提高分類識別率。
與現有技術相比,本發明的有益效果是:利用機器學習數據集的特征,該特征集涵蓋的原始信息多,更加精簡且表達能力更強,有助于快速而準確地進行研究對象的識別與分類,具有良好的魯棒性、準確性和低復雜度,且對宮頸細胞的分類識別率高。
附圖說明
圖1為本發明的流程圖;
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
基于深度學習網絡模型的特征提取方法具體步驟如下:
A、深度學習網絡模型:深度學習網絡模型需要非常大的數據集才能訓練好,所以利用現有的大數據集訓練模型,使模型能準確的提取表達能力強的特征;
B、遷移學習:保留訓練好的深度學習網絡模型中所有卷積層的參數,只是替換最后一層全連接層,修改后最后一層的輸出節點向量可以被作為任何研究對象數據集的特征向量。
深度學習網絡模型是利用每層的卷積層來提取特征,不需要人為設置提取某種特征,更加的方便;遷移學習將一個問題上訓練好的模型通過簡單的調整使其適用于一個新的問題,解決了大數據標注和訓練時間的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810993450.3/2.html,轉載請聲明來源鉆瓜專利網。





