[發明專利]一種運算系統及方法在審
| 申請號: | 201810789039.4 | 申請日: | 2018-07-18 |
| 公開(公告)號: | CN110738221A | 公開(公告)日: | 2020-01-31 |
| 發明(設計)人: | 費旭東;鄒斯騁 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 11309 北京億騰知識產權代理事務所(普通合伙) | 代理人: | 陳霽 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 產生單元 特征提取單元 環境互動 運算系統 概念特征 機器學習 提取單元 行動選擇 影響特征 運算過程 抽取 繼承 申請 | ||
本申請實施例涉及一種提供了一種運算系統及方法,其特征在于,該運算系統包括兩個組成部分,其中一個部分是認識環境、有效抽取環境“概念特征”的特征提取單元,另一個部分是與環境互動的行動產生單元,特征提取單元和行動產生單元在運算過程中,行動產生單元繼承并使用了特征提取單元獲得概念的能力,甚至行動產生單元能夠影響特征提取單元獲得概念的能力。以此實現,將認識環境和與環境互動結合起來進行機器學習,可以更好的理解環境以及根據對環境的理解做出最優的行動選擇。
技術領域
本申請實施例涉及機器學習領域,尤其涉及一種運算系統及方法。
背景技術
深度學習運算已經獲得了非常成功的應用,并處于迅速發展的過程中。目前主要的方向是反向傳播(back propagation,BP)運算、無監督學習運算和弱監督學習運算等。
BP運算可以歸納為,只要有足夠多的標記樣本,就可以通過自動化的學習運算獲得樣本所代表的任何復雜的、由一組參數所定義的映射函數。這個運算目前已經比較成功地解決了語音識別、圖像分類等經典的曾經被認為是非常困難的人工智能問題,因此近年來推動了技術、應用及投資的普遍熱情。
但是這個方法需要人工大量標記數據樣本,不僅成本高昂,而且由于人工標記的局限性,限制了所獲得模型的適應性以及解決更復雜問題的能力。
為此,業界已經將重心轉移到無監督學習運算和弱監督學習運算的方向上。
一種方式是,以無標記的數據樣本作為輸入,通過運算來學習無標記數據樣本所隱含的概念。這類方法通過一個映射(被稱為編碼器),將顯空間的樣本矢量轉換為隱空間的樣本矢量。這個有效的映射可以將顯空間的復雜分布,例如可能是一個復雜的流形狀的分布,轉換為隱空間的簡單分布,例如高斯分布。例如,自編碼(autoencoder,AE),受限玻爾茲曼機(restricted boltzmann machine,RBM),生成式對抗網絡(generativeadversarial networks,GAN)等都屬于這類方法。
相應的,在實現方式上,這類方法通常還需要引入另外一個變換(解碼器),將隱空間的矢量轉換為顯空間的矢量,這個過程被稱為生成過程。
如果兩個映射足夠好,重建的顯空間矢量應該和原矢量一致。但是這顯然理想的效果,通過觀察來獲得的能力依賴訓練樣本的覆蓋度,在樣本覆蓋度不足的情況下,可靠性并不高。例如,實際應用中產生的數據類型可能超出訓練樣本覆蓋的類型范圍,也就是該實際應用中產生的數據超出了觀察樣本所獲得的能力,使得該能力變得不可靠。
發明內容
本申請實施例提供了一種運算系統及方法。以使機器學習得到的能力更可靠。
第一方面,提供了一種運算系統。該運算系統包括兩個組成部分,其中一個部分是認識環境、有效抽取環境“概念特征”的特征提取單元,另一個部分是與環境互動的行動產生單元,特征提取單元和行動產生單元在運算過程中,行動產生單元繼承并使用了特征提取單元獲得概念的能力,甚至行動產生單元能夠影響特征提取單元獲得概念的能力。
通過本發明實施例可以將認識環境和與環境互動結合起來進行機器學習,可以更好的理解環境以及根據對環境的理解做出最優的行動選擇,從而使得學習得到的能力更可靠。
在一個可選地實現中,特征提取單元,用于基于環境獲取本次數據向量;根據一個或多個數據向量提取本次特征向量,其中,所述一個或多個數據向量包括本次數據向量;以及根據所述一個或多個數據向量和所述本次特征向量優化所述特征提取單元;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810789039.4/2.html,轉載請聲明來源鉆瓜專利網。





