[發(fā)明專利]一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法及其實(shí)現(xiàn)裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110430304.1 | 申請(qǐng)日: | 2021-04-21 |
| 公開(kāi)(公告)號(hào): | CN113095423A | 公開(kāi)(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 李宇峰;周志華;黃宇軒 | 申請(qǐng)(專利權(quán))人: | 南京大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N5/02 |
| 代理公司: | 南京樂(lè)羽知行專利代理事務(wù)所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 210023 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 在線 學(xué)習(xí) 數(shù)據(jù) 分類 方法 及其 實(shí)現(xiàn) 裝置 | ||
本發(fā)明公開(kāi)一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法及其實(shí)現(xiàn)裝置,通過(guò)將輸入的無(wú)標(biāo)記(或弱監(jiān)督標(biāo)記)流式數(shù)據(jù)放入當(dāng)前學(xué)習(xí)器,從而獲得對(duì)當(dāng)前流式數(shù)據(jù)預(yù)測(cè)的偽標(biāo)記;對(duì)預(yù)測(cè)得到的偽標(biāo)記,通過(guò)利用知識(shí)庫(kù)(和弱監(jiān)督標(biāo)記),執(zhí)行反繹推理操作得到修改后的偽標(biāo)記;最后,使用修改后的偽標(biāo)記對(duì)學(xué)習(xí)器進(jìn)行更新。上述過(guò)程隨著流式數(shù)據(jù)到來(lái)不斷執(zhí)行。本發(fā)明一方面可以利用一階邏輯表達(dá)的領(lǐng)域知識(shí),使用在線反繹學(xué)習(xí)方法超越傳統(tǒng)在線學(xué)習(xí)方法的性能;另一方面,可快速處理大量流式數(shù)據(jù),能利用無(wú)標(biāo)記或弱標(biāo)記數(shù)據(jù),并且還能處理數(shù)據(jù)中可能出現(xiàn)的新類別。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法及其實(shí)現(xiàn)裝置,屬于大規(guī)模數(shù)據(jù)下的人工智能與模式識(shí)別任務(wù)技術(shù)領(lǐng)域。
背景技術(shù)
在線學(xué)習(xí)是一類主流機(jī)器學(xué)習(xí)算法,在流式數(shù)據(jù)、大規(guī)模數(shù)據(jù)等分類任務(wù)中取得了顯著效果,其主要應(yīng)對(duì)大量標(biāo)記數(shù)據(jù)持續(xù)到來(lái),設(shè)備存儲(chǔ)有限,利用新增訓(xùn)練樣本更新當(dāng)前模型。現(xiàn)有的在線學(xué)習(xí)技術(shù)大都使用數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型實(shí)現(xiàn),具有需要大量標(biāo)注數(shù)據(jù)、難以利用弱標(biāo)注數(shù)據(jù),以及難以利用領(lǐng)域知識(shí)等不足。
發(fā)明內(nèi)容
發(fā)明目的:針對(duì)現(xiàn)有技術(shù)中存在的問(wèn)題與不足,本發(fā)明提供一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法及其實(shí)現(xiàn)裝置。
技術(shù)方案:一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法,接收流式數(shù)據(jù),通過(guò)將輸入的流式數(shù)據(jù)放入當(dāng)前學(xué)習(xí)器,從而獲得對(duì)當(dāng)前樣本預(yù)測(cè)的偽標(biāo)記;將預(yù)測(cè)得到的偽標(biāo)記轉(zhuǎn)化為偽事實(shí),通過(guò)利用知識(shí)庫(kù)和弱標(biāo)記數(shù)據(jù),執(zhí)行反繹推理操作得到修改后的偽事實(shí);最后,將修改后的偽事實(shí)轉(zhuǎn)化為偽標(biāo)記,對(duì)學(xué)習(xí)器進(jìn)行更新;上述過(guò)程隨著流式數(shù)據(jù)到來(lái)不斷執(zhí)行;通過(guò)在線反繹學(xué)習(xí)方法針對(duì)流式訓(xùn)練數(shù)據(jù)與知識(shí)庫(kù)同時(shí)存在的情景,對(duì)弱標(biāo)注或無(wú)標(biāo)注數(shù)據(jù)進(jìn)行分類。
所述流式數(shù)據(jù)為無(wú)標(biāo)記或弱監(jiān)督標(biāo)記的流式數(shù)據(jù)。
基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法流程主要包括三個(gè)部分,隨著數(shù)據(jù)到來(lái)不斷執(zhí)行:
(1)偽標(biāo)記預(yù)測(cè)過(guò)程:取一個(gè)批次的流式數(shù)據(jù),將所有輸入樣本放進(jìn)學(xué)習(xí)器,獲得對(duì)應(yīng)的樣本的偽標(biāo)記作為輸出。
(2)反繹推理標(biāo)記過(guò)程:通過(guò)將偽標(biāo)記轉(zhuǎn)化為偽事實(shí)輸入知識(shí)庫(kù),利用邏輯演算驗(yàn)證偽事實(shí)與知識(shí)庫(kù)是否一致。如果一致,則不對(duì)偽標(biāo)記進(jìn)行修改;如果不一致,則嘗試根據(jù)最小化不一致性的原則對(duì)偽事實(shí)進(jìn)行修改,使得修改后的偽事實(shí)與知識(shí)庫(kù)一致,并將其轉(zhuǎn)化為偽標(biāo)記返回給學(xué)習(xí)器。
(3)更新學(xué)習(xí)器過(guò)程:將反繹推理得到的偽標(biāo)記當(dāng)做真實(shí)標(biāo)記,與當(dāng)前批次的樣本一起用于更新學(xué)習(xí)器。
尋找出錯(cuò)的標(biāo)記位置。使用最小化不一致性的原則,換言之,通過(guò)修改最少數(shù)量的偽事實(shí),使得修改后的事實(shí)盡可能與知識(shí)庫(kù)一致。當(dāng)標(biāo)記數(shù)量大于預(yù)設(shè)數(shù)量時(shí),該過(guò)程可以采用非梯度優(yōu)化的方法進(jìn)行搜索,當(dāng)標(biāo)記數(shù)量小于預(yù)設(shè)數(shù)量時(shí),可以直接進(jìn)行窮舉搜索。具體而言,方法會(huì)首先嘗試尋找某一個(gè)偽標(biāo)記對(duì)應(yīng)的事實(shí),并將其標(biāo)注為可反繹,然后進(jìn)行反繹推理得到修改后與知識(shí)庫(kù)一致的偽事實(shí);若不存在這樣的事實(shí),換言之,任意一個(gè)偽事實(shí)修改后都無(wú)法與知識(shí)庫(kù)一致,則方法會(huì)嘗試尋找某兩個(gè)標(biāo)記對(duì)應(yīng)的偽事實(shí),并將它們標(biāo)注為可反繹并嘗試推理,得到與知識(shí)庫(kù)一致的偽標(biāo)記。若仍不能與知識(shí)庫(kù)一致,則繼續(xù)增加可以修改的標(biāo)記數(shù)量,直到找到能修改后與知識(shí)庫(kù)一致的事實(shí)。
一種基于在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法的實(shí)現(xiàn)裝置,包括:一個(gè)處理器,以及與所述一個(gè)處理器耦合的存儲(chǔ)器;所述存儲(chǔ)器存儲(chǔ)領(lǐng)域知識(shí)庫(kù)和指令,當(dāng)所述指令被所述一個(gè)處理器執(zhí)行時(shí),使得所述一個(gè)處理器執(zhí)行上述的在線反繹學(xué)習(xí)的流式數(shù)據(jù)分類方法。
附圖說(shuō)明
圖1是本發(fā)明方法的分類過(guò)程的流程圖;
圖2是本發(fā)明方法的偽標(biāo)記預(yù)測(cè)流程圖;
圖3是本發(fā)明方法的反繹推理標(biāo)記過(guò)程的流程圖;
圖4是本發(fā)明的裝置的框圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110430304.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于呈現(xiàn)在線實(shí)體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測(cè)預(yù)處理裝置
- 在線測(cè)試學(xué)習(xí)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種在線文檔的分頁(yè)方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問(wèn)平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





