[發(fā)明專利]用于機(jī)器學(xué)習(xí)分類器產(chǎn)生的方法和裝置在審
| 申請?zhí)枺?/td> | 201911026204.1 | 申請日: | 2019-10-25 |
| 公開(公告)號: | CN111104959A | 公開(公告)日: | 2020-05-05 |
| 發(fā)明(設(shè)計)人: | T·巴塞爾;K·古利克森 | 申請(專利權(quán))人: | 激發(fā)認(rèn)知有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京律盟知識產(chǎn)權(quán)代理有限責(zé)任公司 11287 | 代理人: | 章蕾 |
| 地址: | 美國得*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 機(jī)器 學(xué)習(xí) 分類 產(chǎn)生 方法 裝置 | ||
本申請涉及用于機(jī)器學(xué)習(xí)分類器產(chǎn)生的方法和裝置。一種方法包含執(zhí)行第一聚類操作以將第一數(shù)據(jù)集中的成員分組到第一簇群組中并將所述第一簇群組中的每個簇與第一標(biāo)記群組中的對應(yīng)標(biāo)記相關(guān)聯(lián)。所述方法包含執(zhí)行第二聚類操作以將組合數(shù)據(jù)集中的成員分組到第二簇群組中。所述組合數(shù)據(jù)集包含第二數(shù)據(jù)集和所述第一數(shù)據(jù)集的至少一部分。所述方法包含將所述第二簇群組中的一或多個簇與所述第一標(biāo)記群組中的對應(yīng)標(biāo)記相關(guān)聯(lián)并基于第二標(biāo)記群組和所述組合數(shù)據(jù)集產(chǎn)生訓(xùn)練數(shù)據(jù)。所述方法包含基于所述訓(xùn)練數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)分類器以將標(biāo)記提供給第三數(shù)據(jù)集。
技術(shù)領(lǐng)域
本申請大體上涉及機(jī)器學(xué)習(xí)。
背景技術(shù)
分類任務(wù)是一種可以使用機(jī)器學(xué)習(xí)執(zhí)行的任務(wù)類型。在分類任務(wù)中,數(shù)據(jù)集中的每一成員被指派給數(shù)個不同群組或類別中的一個。一些分類任務(wù)可以使用監(jiān)督學(xué)習(xí)來執(zhí)行,其它分類任務(wù)可以使用無監(jiān)督學(xué)習(xí)來執(zhí)行。監(jiān)督學(xué)習(xí)在事先已知劃分每一數(shù)據(jù)的群組或類別時是有用的。例如,監(jiān)督學(xué)習(xí)可用于產(chǎn)生機(jī)器學(xué)習(xí)分類器,以評估實時數(shù)據(jù)流并將數(shù)據(jù)流中的每一數(shù)據(jù)點指派給數(shù)個預(yù)定類別中的一個。使用監(jiān)督學(xué)習(xí)技術(shù)產(chǎn)生機(jī)器學(xué)習(xí)分類器依賴于使用其中事先已知群組成員資格的一組訓(xùn)練數(shù)據(jù)。在監(jiān)督學(xué)習(xí)的上下文中,訓(xùn)練數(shù)據(jù)通常被稱為經(jīng)標(biāo)記訓(xùn)練數(shù)據(jù)或受監(jiān)督訓(xùn)練數(shù)據(jù)。
無監(jiān)督學(xué)習(xí)可以在事先不知曉數(shù)據(jù)被分組到的一組群組或類別時使用。相比于監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)并不依賴于對經(jīng)標(biāo)記訓(xùn)練數(shù)據(jù)的存取。確切地說,無監(jiān)督學(xué)習(xí)技術(shù)可用于使用未標(biāo)記數(shù)據(jù)集基于數(shù)據(jù)集中的相似度或模式來確定數(shù)據(jù)點的分組。無監(jiān)督環(huán)境的一個實例是一種被稱為“聚類”的機(jī)器學(xué)習(xí)類型。
發(fā)明內(nèi)容
本公開描述合作性地使用無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)來產(chǎn)生和更新機(jī)器學(xué)習(xí)分類器的系統(tǒng)和方法。在特定實施方案中,使用聚類操作分析一組未標(biāo)記數(shù)據(jù)以識別簇,其中每一簇對應(yīng)于在數(shù)據(jù)中表示的特定狀態(tài)或條件。基于簇標(biāo)記數(shù)據(jù)以產(chǎn)生經(jīng)標(biāo)記訓(xùn)練數(shù)據(jù)。在一些情況下,基于人為輸入和專門知識標(biāo)記數(shù)據(jù)。為了說明,可以咨詢專家以識別由每一簇中的數(shù)據(jù)點表示的狀態(tài)或條件,并且被專家指派給簇的標(biāo)記與簇中的每一數(shù)據(jù)點相關(guān)聯(lián)。因此,如果專家指示第一簇包含表示裝置的第一正常操作狀態(tài)(或在裝置的第一正常操作狀態(tài)期間搜集)的數(shù)據(jù),那么,第一簇中的每一數(shù)據(jù)點標(biāo)記為“第一正常操作狀態(tài)”。由簇和標(biāo)記操作產(chǎn)生的經(jīng)標(biāo)記數(shù)據(jù)用作受監(jiān)督訓(xùn)練數(shù)據(jù)以產(chǎn)生機(jī)器學(xué)習(xí)分類器。
在訓(xùn)練機(jī)器學(xué)習(xí)分類器之后,機(jī)器學(xué)習(xí)分類器可用于對隨后接收或分析的數(shù)據(jù)(即,不同于原始無監(jiān)督訓(xùn)練數(shù)據(jù)的數(shù)據(jù))進(jìn)行分類。為了說明,在第一時間周期期間可能已經(jīng)收集原始無監(jiān)督訓(xùn)練數(shù)據(jù),并且機(jī)器學(xué)習(xí)分類器可用于對在第一時間周期之后的第二時間周期期間收集的數(shù)據(jù)進(jìn)行分類。
在一些情況下,原始無監(jiān)督訓(xùn)練數(shù)據(jù)可能不包含對應(yīng)于已產(chǎn)生數(shù)據(jù)的系統(tǒng)的每個可能狀態(tài)或條件。為了說明,如果數(shù)據(jù)包含通過監(jiān)測機(jī)器產(chǎn)生的傳感器數(shù)據(jù),那么機(jī)器在期間搜集原始無監(jiān)督訓(xùn)練數(shù)據(jù)的時間周期中可能沒有經(jīng)歷全部正常操作狀態(tài)和故障狀態(tài)。作為另一說明性實例,由于機(jī)械磨損、正常傳感器漂移等等,表示機(jī)器的正常操作狀態(tài)的數(shù)據(jù)可隨時間推移而漂移。在此實例中,不表示期間搜集原始無監(jiān)督訓(xùn)練數(shù)據(jù)的時間周期中的特定正常操作狀態(tài)的數(shù)據(jù)可在之后表示所述特定正常操作狀態(tài)。因此,在此實例中,為了隨時間推移對機(jī)器的操作狀態(tài)進(jìn)行精確分類,應(yīng)該偶爾更新機(jī)器學(xué)習(xí)分類器。
更新機(jī)器學(xué)習(xí)分類器可能極其昂貴、費時且勞動密集。例如,按照上述步驟,需要專家在每次更新機(jī)器學(xué)習(xí)分類器時標(biāo)記每個簇,因為用于更新機(jī)器學(xué)習(xí)分類器的受監(jiān)督訓(xùn)練數(shù)據(jù)是從專家標(biāo)記的簇導(dǎo)出的。本文中所描述的簇和標(biāo)記映射技術(shù)可用于減少更新機(jī)器學(xué)習(xí)分類器所涉及的時間、支出和勞動。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于激發(fā)認(rèn)知有限公司,未經(jīng)激發(fā)認(rèn)知有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911026204.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





