[發(fā)明專利]基于數(shù)據(jù)驅(qū)動遺傳編程算法的符號回歸方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110273698.4 | 申請日: | 2021-03-15 |
| 公開(公告)號: | CN113111308B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設計)人: | 鐘競輝;林煜森 | 申請(專利權(quán))人: | 華南理工大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06N3/126 |
| 代理公司: | 廣州市華學知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 林梅繁 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 數(shù)據(jù) 驅(qū)動 遺傳 編程 算法 符號 回歸 方法 系統(tǒng) | ||
本發(fā)明涉及基于數(shù)據(jù)驅(qū)動遺傳編程算法的符號回歸方法與系統(tǒng),其方法包括步驟:S1、通過輸入元素集計算各個特征與輸出之間的互信息值,計算各個特征與輸出之間的MIC值;S2、通過生成隨機函數(shù),再生成訓練圖像,進行CNN訓練,由CNN生成函數(shù)元素重要性權(quán)重向量;S3、初始化多染色體編碼方式的種群,若滿足終止條件,則結(jié)束;否則,更新種群,進行突變與交叉變異,再進行染色體解碼,并評估適應值,進行選擇后再循環(huán)判斷是否滿足終止條件。本發(fā)明通過選擇重要終端元素和函數(shù)元素的機制,采用多染色體編碼方法提高遺傳編程算法的搜索性能,從而有效地解決符號回歸問題。
技術(shù)領域
本發(fā)明涉及智能計算和特征工程技術(shù)領域,尤其涉及基于數(shù)據(jù)驅(qū)動遺傳編程算法的符號回歸方法及系統(tǒng)。
背景技術(shù)
符號回歸是一種試圖發(fā)現(xiàn)某種隱藏的數(shù)學公式,以此利用特征變量預測目標變量的監(jiān)督學習方法。與傳統(tǒng)的回歸方法,如線性回歸、多項式回歸、人工神經(jīng)網(wǎng)絡等相比,符號回歸不需要事先給定具體函數(shù)形式,不需要任何先驗知識和模型,同時能夠提供直觀顯式的函數(shù)表達式模型,有助于研究者理解和分析待研究系統(tǒng)的內(nèi)在機理。因此,符號回歸近年來被應用于諸如時間序列預測、數(shù)據(jù)挖掘、模式分類和系統(tǒng)設計優(yōu)化等領域,目前已成為智能計算領域的一個研究熱點。
現(xiàn)有的符號回歸算法主要分為基于確定性優(yōu)化技術(shù)的算法和基于啟發(fā)式優(yōu)化技術(shù)的遺傳編程算法。由于確定性優(yōu)化技術(shù)只適用于規(guī)模較小的問題,目前求解符號回歸問題的主流算法是遺傳編程算法。遺傳編程算法是一類通過模擬自然界“適者生存,優(yōu)勝劣汰”的進化現(xiàn)象實現(xiàn)計算機自主編程的智能計算優(yōu)化算法。遺傳編程算法求解符號回歸問題主要具有兩大優(yōu)勢:一是遺傳編程算法編碼機制靈活可變,很適合表示進化函數(shù)的結(jié)構(gòu);二是遺傳編程算法的搜索過程基于隨機啟發(fā)式搜索,不需要建立復雜的優(yōu)化模型,這使得其具有很強的通用性且可以同時優(yōu)化多個目標。
然而,現(xiàn)階段遺傳編程算法在選擇元素構(gòu)建解的過程中仍存在著不足。如何選擇合適的元素集是遺傳編程算法中一個基本的而具有挑戰(zhàn)性的問題,也制約著遺傳編程算法更好地應用于實際問題中。
遺傳編程算法的元素集由函數(shù)元素和終端元素(即特征元素)組成。函數(shù)元素(如*,sin)通過連接終端元素(如變量x,y)來構(gòu)造解。因此函數(shù)元素和終端元素決定了遺傳編程算法解的搜索空間,兩者共同地影響著遺傳編程算法的性能。一方面,為了確保找到高質(zhì)量的解,函數(shù)元素集應當設置得足夠大。但這將極大地增加搜索空間,降低搜索效率,使遺傳編程算法容易陷入局部最優(yōu)解。另一方面,選擇有用的特征作為終端元素集也影響著遺傳編程算法的性能。通過識別有用特征子集并去除不相關特征可以減少搜索空間,提高遺傳編程算法搜索效率。
現(xiàn)有的元素選擇方法主要是利用特征工程縮小終端元素集的空間,從而改進遺傳編程算法的性能。然而,當函數(shù)集很大并且包含不相關的函數(shù)元素時,這些方法是不夠有效的,同時往往沒有考慮常數(shù)問題,因此導致了不準確的求解。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)所存在的技術(shù)問題,本發(fā)明提供基于數(shù)據(jù)驅(qū)動遺傳編程算法的符號回歸方法及系統(tǒng),通過選擇重要終端元素和函數(shù)元素的機制,采用多染色體編碼方法提高遺傳編程算法的搜索性能,從而有效地解決符號回歸問題。
本發(fā)明方法采用以下技術(shù)方案來實現(xiàn):基于數(shù)據(jù)驅(qū)動遺傳編程算法的符號回歸方法,包括以下步驟:
S1、通過輸入元素集計算各個特征與輸出之間的互信息值,再計算各個特征與輸出之間的MIC值,根據(jù)MIC值找出重要的特征集,并決定參與步驟S2的重要的特征集以及步驟S3的終端元素;
S2、利用步驟S1中找出的重要的特征集生成隨機函數(shù),再生成訓練圖像,進行CNN訓練,由CNN生成函數(shù)元素重要性權(quán)重向量;
S3、初始化遺傳編程算法與多染色體編碼方式的種群,若滿足終止條件,則結(jié)束;否則,更新種群,進行突變與交叉變異,再進行染色體解碼,并評估適應值,進行選擇后再循環(huán)判斷是否滿足終止條件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學,未經(jīng)華南理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110273698.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





