[發明專利]一種基于DQN的超聲波驅鳥最優頻率的選擇方法有效
| 申請號: | 202010530522.8 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111972394B | 公開(公告)日: | 2022-01-21 |
| 發明(設計)人: | 陳益平;張羽;周慶東;藍偉松;甘團杰;劉天紹;張家耀;吳華標;周宇堯;莫鉅槐;張經緯 | 申請(專利權)人: | 廣東電網有限責任公司;廣東電網有限責任公司江門供電局 |
| 主分類號: | A01M29/18 | 分類號: | A01M29/18;G06N3/04;G06F16/9537 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 陳偉斌 |
| 地址: | 510050 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 dqn 超聲波 最優 頻率 選擇 方法 | ||
1.一種基于DQN的超聲波驅鳥最優頻率的選擇方法,其特征在于,具體包括如下步驟:
S1:初始化鳥害防護裝置的Q神經網絡的權重θ、迭代次數閥值、先驗知識、經驗池和迭代次數;
S2:更新Q神經網絡的權重θ;
S3:使用多普勒雷達進行探測,讀取探測范圍內鳥的狀態st;
S4:對鳥的狀態st進行判斷,如鳥類停留在探測范圍內,繼續步驟S5,如鳥類沒有停留在探測范圍內,重復步驟S3~S4;
S5:判斷是否具有本地區的驅鳥先驗知識,包括本地區較為有效的超聲波驅鳥頻率;如有,則結合先驗知識,選擇Q值最大的頻率;否則,則根據DQN算法估計發射的最優頻率;
S6:根據選定的最優頻率,執行動作at使用超聲波發射電路發射該頻率的超聲波;
S7:再次使用多普勒雷達探測鳥類的狀態st+1以及反饋rt;
S8:將(st,at,rt,st+1)存入經驗池;
S9:判斷經驗池是否已滿,若未滿,則重復S3~S8;若滿,則進入S10;
S10:獲取Q神經網絡,根據預設的初始狀態從Q神經網絡中獲得頻率調整指令;然后重復:調整頻率后查詢鳥類的狀態,再根據狀態調整頻率;當鳥類的狀態轉為離開時,生成得到鳥害防護裝置的最優驅鳥頻率。
2.根據權利要求1所述的一種基于DQN的超聲波驅鳥最優頻率的選擇方法,其特征在于,在步驟S1中,先驗知識為根據某地區鳥害防護的數據總結得出,包括某地區鳥害最嚴重的鳥類及其最敏感的頻率范圍。
3.根據權利要求2所述的一種基于DQN的超聲波驅鳥最優頻率的選擇方法,其特征在于,DQN算法為利用卷積神經網絡對Q表建模,以完整表示所有的狀態和動作空間。
4.根據權利要求1所述的一種基于DQN的超聲波驅鳥最優頻率的選擇方法,其特征在于,在步驟S2中根據DQN計算的Q值,通過對損失函數使用梯度下降法更新權重θ;
其中損失函數為:Li(θi)=Es,a~ρ(s,a)[(yi-Q(s,a;θi))2];
其中,Q(s,a;θi)為Q(s,a)的估計值;E為期望,yi代表Q(s,a),i為迭代的次數;s為當前鳥類狀態;a為當前發射選擇頻率的超聲波;s′為發射超聲波之后鳥類狀態;a′為下一個發射選擇頻率的超聲波;ρ(s,a)為鳥類狀態s和發射超聲波a之間的概率分布。
5.根據權利要求4所述的一種基于DQN的超聲波驅鳥最優頻率的選擇方法,其特征在于,根據Bellman方程得出的Q(s,a)記為yi,
Bellman方程為V(s)=maxα(R(s,a)+γV(s′));
其中R為獎勵函數,s為某一特定時間點的狀態,a為對當前狀態計算后采取的行動,γV(s′)為后繼狀態的折扣價值函數,γ為衰減系數,α為動作和狀態映射;
yi的具體計算公式為:yi=Es′[r+γmaxa′Qi(s′,a′;θi-1)|s,a];
其中,Q(s,a;θi)為Q(s,a)的估計值;i為迭代的次數;s為當前鳥類狀態;a為當前發射選擇頻率的超聲波;s′為發射超聲波之后鳥類狀態;a′為下一個發射選擇頻率的超聲波;ρ(s,a)為鳥類狀態s和發射超聲波a之間的概率分布。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司;廣東電網有限責任公司江門供電局,未經廣東電網有限責任公司;廣東電網有限責任公司江門供電局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010530522.8/1.html,轉載請聲明來源鉆瓜專利網。





