[發(fā)明專(zhuān)利]一種基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的天文圖像自動(dòng)化分類(lèi)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110853849.3 | 申請(qǐng)日: | 2021-07-28 |
| 公開(kāi)(公告)號(hào): | CN113723456B | 公開(kāi)(公告)日: | 2023-10-17 |
| 發(fā)明(設(shè)計(jì))人: | 鄒志強(qiáng);韓楊;吳家皋;張芷瑞;洪舒欣 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京郵電大學(xué) |
| 主分類(lèi)號(hào): | G06V10/764 | 分類(lèi)號(hào): | G06V10/764;G06V10/762;G06V10/40;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 南京縱橫知識(shí)產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 王麗霞 |
| 地址: | 210023 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 監(jiān)督 機(jī)器 學(xué)習(xí) 天文 圖像 自動(dòng)化 分類(lèi) 方法 系統(tǒng) | ||
本發(fā)明公開(kāi)了一種基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的天文圖像自動(dòng)化分類(lèi)方法及系統(tǒng)。方法包括:對(duì)待分類(lèi)天文圖像數(shù)據(jù)進(jìn)行預(yù)處理;將預(yù)處理后的天文圖像數(shù)據(jù)輸入訓(xùn)練好的卷積自編碼網(wǎng)絡(luò)模型,提取天文圖像特征,得到天文圖像特征集;將得到的天文圖像特征集輸入圖像特征聚類(lèi)模型,輸出每個(gè)天文圖像屬于每個(gè)聚類(lèi)簇的概率;對(duì)已經(jīng)聚類(lèi)成簇的天文圖像進(jìn)行人工打分,得到每個(gè)聚類(lèi)簇屬于每個(gè)類(lèi)的概率;將每個(gè)天文圖像屬于每個(gè)聚類(lèi)簇的概率與每個(gè)聚類(lèi)簇屬于每個(gè)類(lèi)的概率相乘,得到每個(gè)天文圖像屬于每個(gè)類(lèi)的概率,再通過(guò)閾值篩選完成分類(lèi)。本發(fā)明能夠本發(fā)明以較小的代價(jià)在沒(méi)有數(shù)據(jù)標(biāo)簽的情況下獲得較高的天文圖像數(shù)據(jù)分類(lèi)準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的天文圖像自動(dòng)化分類(lèi)方法及系統(tǒng),屬于天文圖像智能處理技術(shù)領(lǐng)域。
背景技術(shù)
星系形成與演化是天體物理學(xué)中一個(gè)重要的科學(xué)問(wèn)題,同時(shí)星系形態(tài)是星系的形成與演化中重要的參考指標(biāo),它與許多物理參數(shù),包括質(zhì)量、恒星形成歷史和質(zhì)量分布有很強(qiáng)的相關(guān)性。在Galaxy zoo1.0項(xiàng)目收集了來(lái)自斯隆數(shù)字天空調(diào)查的近90萬(wàn)個(gè)星系的簡(jiǎn)單形態(tài),由成千上萬(wàn)的志愿者歷時(shí)數(shù)月完成了星系形態(tài)的分類(lèi)。隨著科學(xué)技術(shù)的發(fā)展,觀測(cè)設(shè)備不斷升級(jí),例如LSST(Large Synoptic Survey Telescope美國(guó)大視場(chǎng)時(shí)空巡天項(xiàng)目)、EUCLID(歐盟歐幾里得空間站巡天項(xiàng)目)、CSST(China Space Station Telescope中國(guó)巡天太空望遠(yuǎn)鏡項(xiàng)目)等項(xiàng)目的建立,我們將邁向大尺度巡天時(shí)代,屆時(shí)天文領(lǐng)域的數(shù)據(jù)集會(huì)以指數(shù)速度增長(zhǎng)。例如Galaxy zoo 2.0項(xiàng)目從SDSS中搜集了1.6億的星系用來(lái)確定星系形態(tài)進(jìn)而研究星系的形成與演化,面對(duì)龐大的星系圖像數(shù)據(jù)集,使用人眼觀測(cè)的方法并不能有效解決這一問(wèn)題,因此天文學(xué)家們把目光轉(zhuǎn)向了一種自動(dòng)分類(lèi)方法。
近些年來(lái)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法在星系形態(tài)分類(lèi)領(lǐng)域有了一定的嘗試和應(yīng)用。2010年,Gauci等人提出了將決策樹(shù)學(xué)習(xí)算法和隨機(jī)森林算法相結(jié)合的星系形態(tài)分類(lèi)模型。2015年,F(xiàn)errari等人采用線性判別分析(LDA)技術(shù)進(jìn)行星系形態(tài)分類(lèi)。機(jī)器學(xué)習(xí)算法通常需要復(fù)雜的特征工程,需要先在數(shù)據(jù)集上執(zhí)行探索性的數(shù)據(jù)分析,然后通過(guò)降維將數(shù)據(jù)傳遞給機(jī)器學(xué)習(xí)算法,同時(shí)為得到最好的實(shí)驗(yàn)結(jié)果,需要選擇最佳的特征,為避免特征工程這一復(fù)雜的過(guò)程,天文學(xué)家開(kāi)始嘗試深度學(xué)習(xí)來(lái)解決星系形態(tài)分類(lèi)任務(wù)。
2006年Hinton提出了深度學(xué)習(xí)的概念,通過(guò)構(gòu)建多層的人工神經(jīng)網(wǎng)絡(luò),在各個(gè)領(lǐng)域做出了積極貢獻(xiàn)。深度學(xué)習(xí)通過(guò)多個(gè)非線性層對(duì)輸入的數(shù)據(jù)進(jìn)行特征提取和抽象,進(jìn)而對(duì)圖像進(jìn)行分類(lèi)。盡管深度學(xué)習(xí)在星系分類(lèi)領(lǐng)域取得了的不小的成就,但是深度學(xué)習(xí)方法訓(xùn)練模型時(shí),對(duì)訓(xùn)練集的數(shù)據(jù)標(biāo)簽有著強(qiáng)烈的依賴(lài),但是現(xiàn)實(shí)情況是,為天文圖像標(biāo)記標(biāo)簽是一件專(zhuān)業(yè)性很強(qiáng)的工作,而且需要消耗專(zhuān)家大量的時(shí)間成本,此外,使用人工給天文圖像打標(biāo)簽,在一定程度上引入了對(duì)天文圖像的人為偏見(jiàn),而這些人為偏見(jiàn)往往難以被人們發(fā)現(xiàn)。
發(fā)明內(nèi)容
發(fā)明目的:隨著天文大數(shù)據(jù)時(shí)代的到來(lái),天文圖片將呈指數(shù)增長(zhǎng),短時(shí)間內(nèi)獲得大量的有標(biāo)簽天文數(shù)據(jù)將變得不那么實(shí)際,屆時(shí)有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)會(huì)存在諸多不足,本發(fā)明的目的在于提供一種基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的天文圖像自動(dòng)化分類(lèi)方法及系統(tǒng),以解決在數(shù)據(jù)沒(méi)有標(biāo)簽的情況下難以直接對(duì)天文圖像進(jìn)行準(zhǔn)確分類(lèi)的問(wèn)題。
要實(shí)現(xiàn)上述發(fā)明內(nèi)容,必須要解決幾個(gè)核心問(wèn)題:(1)目前存在的天文圖像分類(lèi)方法中考慮的數(shù)據(jù)大多需要人工對(duì)數(shù)據(jù)集進(jìn)行標(biāo)記,例如Galaxy zoo數(shù)據(jù)集被發(fā)布在網(wǎng)站上,以眾包的形式讓天文愛(ài)好者去共同完成分類(lèi)工作,這種眾包方式不僅耗時(shí),也會(huì)帶入人為偏見(jiàn);(2)無(wú)監(jiān)督分類(lèi)方法大多局限于聚類(lèi)模型。由于天文圖像是高維圖像數(shù)據(jù),其數(shù)據(jù)往往以三維圖像呈現(xiàn),面對(duì)大量的高維數(shù)據(jù),一般的聚類(lèi)模型會(huì)陷入維度詛咒或者難以處理如此大規(guī)模、高緯度的天文圖像數(shù)據(jù)。
技術(shù)方案:為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
一方面,本發(fā)明提供了一種基于無(wú)監(jiān)督機(jī)器學(xué)習(xí)的天文圖像自動(dòng)化分類(lèi)方法,包括:
對(duì)待分類(lèi)天文圖像數(shù)據(jù)進(jìn)行預(yù)處理;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110853849.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





