[發明專利]一種基于堆棧式自編碼和PSO算法的數據壓縮方法及裝置有效
| 申請號: | 201710971619.0 | 申請日: | 2017-10-18 |
| 公開(公告)號: | CN107749757B | 公開(公告)日: | 2020-08-14 |
| 發明(設計)人: | 盧世祥;闕華坤;林國營 | 申請(專利權)人: | 廣東電網有限責任公司電力科學研究院 |
| 主分類號: | H03M7/30 | 分類號: | H03M7/30;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張春水;唐京橋 |
| 地址: | 510080 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 堆棧 編碼 pso 算法 數據壓縮 方法 裝置 | ||
本發明實施例公開了一種基于堆棧式自編碼和PSO算法的數據壓縮方法。本發明中堆棧式自編碼模型為一種深度學習模型,通過逐層學習算法和整體網絡權值的微調可以提高神經網絡的訓練速度,去除數據中冗余信息,提取到原始數據中最有價值的信息,同時堆棧式自編碼模型的多層網絡結構賦予堆棧式自編碼模型良好的非線性映射能力,逐層學習算法和整體網絡權值的微調可以為堆棧式自編碼模型賦予了適用于表現樣本的權值,學習到數據本身的特征,無需輸入數據具備標簽,堆棧式自編碼器的網絡參數通過PSO算法進行整定,進一步提高精度和搜索速度,解決了現有使用淺層神經網絡進行數據壓縮時收斂速度慢、非線性映射能力差以及需要輸入數據帶有標簽的技術問題。
技術領域
本發明涉及數據挖掘領域,尤其涉及一種基于堆棧式自編碼和PSO算法的數據壓縮方法及裝置。
背景技術
當前利用神經網絡進行數據壓縮是通過淺層神經網絡模型進行數據壓縮,利用淺層神經網絡模型進行數據壓縮存在以下不足:1、當前訓練淺層神經網絡模型的算法大多數是BP算法,BP算法收斂速度慢,容易陷入局部極小值點,并且淺層神經網絡模型容易被新的特征擾動;2、由于訓練算法的特點使得淺層神經網絡模型的層數不能太多,非線性映射能力較差,因為誤差在反向傳播過程中會逐步遞減,層數太多會導致誤差前向傳播中變得極小,無法有效更新權值;3、淺層神經網絡訓練算法需要輸入數據都是有標簽的,以便于得到誤差修改淺層神經網絡的權值,使得淺層神經網絡可以學習到數據的特征,但是在實際應用中大多數數據是沒有標簽的,導致了淺層神經網絡具有一定的局限性。因此,導致了現有使用淺層神經網絡進行數據壓縮時收斂速度慢、非線性映射能力差以及需要輸入數據帶有標簽的技術問題。
發明內容
本發明提供了一種基于堆棧式自編碼和PSO算法的數據壓縮方法及裝置,解決了現有使用淺層神經網絡進行數據壓縮時收斂速度慢、非線性映射能力差以及需要輸入數據帶有標簽的技術問題。
本發明提供了一種基于堆棧式自編碼和PSO算法的數據壓縮方法,包括:
S1:通過PSO算法、預置迭代次數限值和預置適應度閾值對堆棧式自編碼模型的網絡參數進行整定;
S2:獲取訓練樣本,對經過網絡參數整定的堆棧式自編碼模型進行訓練;
S3:將未壓縮的數據輸入經過網絡參數整定和訓練的堆棧式自編碼模型,獲取隱含層的輸出數據作為壓縮后的數據。
優選地,步驟S1具體包括:
S101:初始化M個粒子,包括隨機位置和速度,每個粒子預置N個維度,分別對應堆棧式自編碼器待整定的N個網絡參數,其中M和N皆為大于0的整數;
S102:對每個粒子的位置和速度進行更新和迭代,并通過適應度函數計算每個粒子當前位置的適應度;
S103:當迭代次數達到預置迭代次數限值或者每個粒子的適應度變化率都低于預置適應度閾值,則停止迭代,獲取經過整定的堆棧式自編碼模型的網絡參數,否則返回步驟S102。
優選地,步驟S2之后,步驟S3之前還包括:步驟S4;
S4:對未壓縮的數據進行歸一化處理、數據矯正和數據補全,得到新的未壓縮數據。
優選地,步驟S3之后還包括:步驟S5;
S5:將壓縮后的數據通過差分編碼和哥倫布編碼進行無損壓縮,獲取新的壓縮后的數據。
優選地,步驟S5具體包括:
S501:將壓縮后的數據進行小數定標標準化處理,獲得第一序列;
S502:將第一序列進行差分編碼獲得第二序列;
S503:將第二序列進行0階哥倫布編碼獲得第三序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司電力科學研究院,未經廣東電網有限責任公司電力科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710971619.0/2.html,轉載請聲明來源鉆瓜專利網。





