[發明專利]一種基于在線反繹學習的流式數據分類方法及其實現裝置在審
| 申請號: | 202110430304.1 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN113095423A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 李宇峰;周志華;黃宇軒 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N5/02 |
| 代理公司: | 南京樂羽知行專利代理事務所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 在線 學習 數據 分類 方法 及其 實現 裝置 | ||
1.一種基于在線反繹學習的流式數據分類方法,其特征在于,接收流式數據,通過將輸入的流式數據放入當前學習器,從而獲得對當前樣本預測的偽標記;將預測得到的偽標記轉化為偽事實,通過利用知識庫和弱標記數據,執行反繹推理操作得到修改后的偽事實;最后,將修改后的偽事實轉化為偽標記,對學習器進行更新;上述過程隨著流式數據到來不斷執行;通過在線反繹學習方法針對流式訓練數據與知識庫同時存在的情景,對弱標注或無標注數據進行分類。
2.根據權利要求1所述的基于在線反繹學習的流式數據分類方法,其特征在于,所述流式數據為無標記或弱監督標記的流式數據。
3.根據權利要求1所述的基于在線反繹學習的流式數據分類方法,其特征在于,偽標記預測過程為:取一個批次的流式數據,將所有輸入樣本放進學習器,獲得對應的樣本的偽標記作為輸出。
4.根據權利要求1所述的基于在線反繹學習的流式數據分類方法,其特征在于,反繹推理標記過程為:通過將偽標記轉化為偽事實輸入知識庫,利用邏輯演算驗證偽事實與知識庫是否一致;如果一致,則不對偽標記進行修改;如果不一致,則根據最小化不一致性的原則對偽事實進行修改,使得修改后的偽事實與知識庫一致,并將其轉化為偽標記返回給學習器。
5.根據權利要求1所述的基于在線反繹學習的流式數據分類方法,其特征在于,更新學習器過程:將反繹推理得到的偽標記當做真實標記,與當前批次的樣本一起用于更新學習器。
6.根據權利要求1所述的基于在線反繹學習的流式數據分類方法,其特征在于,通過修改最少數量的偽事實,使得修改后的事實盡可能與知識庫一致;當標記數量大于預設數量時,采用非梯度優化的方法進行搜索,當標記數量小于預設數量時,直接進行窮舉搜索;尋找出錯的標記位置的過程為:首先嘗試尋找某一個偽標記對應的事實,并將其標注為可反繹,然后進行反繹推理得到修改后與知識庫一致的偽事實;若不存在這樣的事實,換言之,任意一個偽事實修改后都無法與知識庫一致,則尋找某兩個標記對應的偽事實,并將它們標注為可反繹并嘗試推理,得到與知識庫一致的偽標記;若仍不能與知識庫一致,則繼續增加可以修改的標記數量,直到找到能修改后與知識庫一致的事實。
7.一種基于在線反繹學習的流式數據分類方法的實現裝置,其特征在于,包括:一個處理器,以及與所述一個處理器耦合的存儲器;所述存儲器存儲領域知識庫和指令,當所述指令被所述一個處理器執行時,使得所述一個處理器執行上述的在線反繹學習的流式數據分類方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110430304.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





