[發(fā)明專利]一種基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811283054.8 | 申請(qǐng)日: | 2018-10-31 |
| 公開(kāi)(公告)號(hào): | CN109491320B | 公開(kāi)(公告)日: | 2019-12-06 |
| 發(fā)明(設(shè)計(jì))人: | 楊建中;向單奇;武俊雄;高嵩;朱萬(wàn)強(qiáng);宋仕杰;傅有 | 申請(qǐng)(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號(hào): | G05B19/19 | 分類號(hào): | G05B19/19 |
| 代理公司: | 42201 華中科技大學(xué)專利中心 | 代理人: | 孔娜;曹葆青<國(guó)際申請(qǐng)>=<國(guó)際公布>= |
| 地址: | 430074 湖北*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 刀具路徑 神經(jīng)網(wǎng)絡(luò)模型 環(huán)境仿真 評(píng)判 強(qiáng)化學(xué)習(xí) 計(jì)算機(jī)輔助 人工智能 加工起始 加工信息 輸出 刀具 優(yōu)化 傳輸 重復(fù) 加工 | ||
本發(fā)明屬于人工智能和計(jì)算機(jī)輔助相關(guān)技術(shù)領(lǐng)域,其公開(kāi)了一種基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法,該方法包括以下步驟:(1)將加工信息輸入到環(huán)境仿真模型;(2)環(huán)境仿真模型依據(jù)來(lái)自深度神經(jīng)網(wǎng)絡(luò)模型的動(dòng)作值產(chǎn)生狀態(tài)值,并將狀態(tài)值輸出給深度神經(jīng)網(wǎng)絡(luò)模型,深度神經(jīng)網(wǎng)絡(luò)模型根據(jù)狀態(tài)值作產(chǎn)生新的動(dòng)作值,并將新的動(dòng)作值傳輸給環(huán)境仿真模型,如此兩者不斷交互,使得刀具從加工起始點(diǎn)到達(dá)加工終點(diǎn),進(jìn)而生成刀具路徑;(3)重復(fù)步驟(2)以獲得多條刀具路徑,將多條刀具路徑輸入到路徑評(píng)判模塊,路徑評(píng)判模塊對(duì)每刀具路徑做出判斷并輸出評(píng)判分?jǐn)?shù),將評(píng)判分?jǐn)?shù)最高的刀具路徑作為最終的刀具路徑。本發(fā)明提高精度及效率,適用性較強(qiáng)。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能和計(jì)算機(jī)輔助相關(guān)技術(shù)領(lǐng)域,更具體地,涉及一種基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法。
背景技術(shù)
為了提高數(shù)控機(jī)床的加工技術(shù)的應(yīng)用水平,降低數(shù)控加工的加工成本以及確保零件與產(chǎn)品的加工質(zhì)量,無(wú)論是國(guó)內(nèi)還是國(guó)外對(duì)數(shù)控加工中的刀具軌跡優(yōu)化技術(shù)做了大量的研究工作。在數(shù)控加工過(guò)程中,當(dāng)?shù)毒哕壽E驟然變化時(shí),有可能會(huì)導(dǎo)致刀具瞬間銑削力急劇增大,機(jī)床和刀具的振動(dòng)幅度增加,這樣不僅會(huì)降低零件或產(chǎn)品的加工精度,還會(huì)降低機(jī)床和刀具的使用壽命。因此,刀具路徑的研究具有十分重要的理論意義和經(jīng)濟(jì)效益。
目前,本領(lǐng)域相關(guān)技術(shù)人員已經(jīng)做了一些研究,如采用了機(jī)器學(xué)習(xí)技術(shù),然而當(dāng)前的加工軌跡生成方法大都是基于幾何形狀而沒(méi)有考慮實(shí)際加工過(guò)程中的動(dòng)力學(xué)問(wèn)題,導(dǎo)致刀具路徑的生成速度較差、加速特性不佳、與實(shí)際機(jī)械加工過(guò)程的契合度較低、需要人為參與、靈活性較差等技術(shù)問(wèn)題。相應(yīng)地,本領(lǐng)域存在發(fā)展一種速度較好的基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法的技術(shù)需求。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法,其基于現(xiàn)有刀具路徑的生成特點(diǎn),研究及設(shè)計(jì)了一種速度較好的基于強(qiáng)化學(xué)習(xí)的刀具路徑生成與優(yōu)化方法。所述方法結(jié)合了強(qiáng)化學(xué)習(xí)強(qiáng)大的決策能力及深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的感知能力,且考慮了實(shí)際加工過(guò)程中的運(yùn)動(dòng)學(xué)及動(dòng)力學(xué)特性,能夠在公差帶之中快速、準(zhǔn)確地規(guī)劃一條更加符合實(shí)際加工過(guò)程的刀具路徑。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的刀具路徑生成及優(yōu)化方法,該方法包括以下步驟:
(1)將加工信息輸入到環(huán)境仿真模型,所述環(huán)境仿真模型依據(jù)所述加工信息產(chǎn)生仿真刀具加工環(huán)境及加工的公差帶,并將所述公差帶輸入到所述仿真刀具加工環(huán)境中;
(2)所述環(huán)境仿真模型依據(jù)來(lái)自訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型的動(dòng)作值產(chǎn)生狀態(tài)值,并將所述狀態(tài)值輸出給所述深度神經(jīng)網(wǎng)絡(luò)模型,所述深度神經(jīng)網(wǎng)絡(luò)模型根據(jù)接受到的所述狀態(tài)值作前向推導(dǎo)以產(chǎn)生新的動(dòng)作值,并將新的動(dòng)作值傳輸給所述環(huán)境仿真模型,如此所述環(huán)境仿真模型與所述深度神經(jīng)網(wǎng)絡(luò)模型不斷交互,使得刀具不斷做出動(dòng)作以從加工起始點(diǎn)沿著所述公差帶延伸方向到達(dá)加工終點(diǎn),進(jìn)而生成一條刀具路徑;
(3)重復(fù)步驟(2)以獲得多條刀具路徑,將多條所述刀具路徑輸入到路徑評(píng)判模塊,所述路徑評(píng)判模塊對(duì)接收到的每一條刀具路徑做出判斷并輸出一個(gè)評(píng)判分?jǐn)?shù),將多條所述刀具路徑中評(píng)判分?jǐn)?shù)最高的刀具路徑作為最終的刀具路徑。
進(jìn)一步地,所述加工信息包括工件輪廓信息、公差帶帶寬及刀具半徑。
進(jìn)一步地,步驟(1)之前還包括構(gòu)建所述環(huán)境仿真模型的步驟,所述環(huán)境仿真模型的構(gòu)建包括以下步驟:首先,對(duì)實(shí)際加工過(guò)程進(jìn)行建模以得到刀具加工模型,且對(duì)加工過(guò)程中機(jī)床給予刀具的動(dòng)力及摩擦力進(jìn)行分析,以抽象出加工過(guò)程中的刀具動(dòng)力學(xué)過(guò)程;接著,對(duì)所述刀具加工模型中的摩擦系數(shù)進(jìn)行辨識(shí);最后,采用物理引擎構(gòu)建仿真環(huán)境,進(jìn)而得到所述環(huán)境仿真模型。
進(jìn)一步地,所述環(huán)境仿真模型根據(jù)接受到的該動(dòng)作值仿真計(jì)算出下一刻刀具所處的狀態(tài),并將該狀態(tài)以狀態(tài)值的形式傳輸給所述深度神經(jīng)網(wǎng)絡(luò)模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811283054.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 一種基于虛擬網(wǎng)卡的無(wú)線信道仿真方法
- 一種汽車(chē)駕駛仿真器與虛擬交通環(huán)境仿真系統(tǒng)的交互方法
- 可復(fù)用的用于仿真環(huán)境集成的仿真組件及方法
- 基于應(yīng)用容器引擎的本地仿真方法、裝置及存儲(chǔ)介質(zhì)
- 多任務(wù)仿真運(yùn)行方法、裝置及存儲(chǔ)介質(zhì)
- 一種仿真測(cè)試環(huán)境的生成方法及裝置
- 一種自動(dòng)駕駛仿真方法及系統(tǒng)
- 一種復(fù)雜產(chǎn)品協(xié)同仿真環(huán)境構(gòu)建方法
- 一種仿真測(cè)試的方法及裝置
- 一種仿真測(cè)試的方法及裝置
- 一種對(duì)空氣質(zhì)量數(shù)據(jù)進(jìn)行多級(jí)綜合評(píng)判的方法
- 地理信息建庫(kù)制圖數(shù)據(jù)的質(zhì)量評(píng)判方法、裝置及系統(tǒng)
- 一種面向Appium的Java測(cè)試代碼質(zhì)量評(píng)判方法
- 網(wǎng)站服務(wù)能力的評(píng)估方法及裝置
- 一種基于環(huán)境感知的駕駛技能考試評(píng)判設(shè)備、系統(tǒng)及方法
- 電力現(xiàn)貨市場(chǎng)的運(yùn)營(yíng)狀況評(píng)判方法及裝置
- 賬號(hào)信息管理方法、裝置及設(shè)備
- 一種文章表達(dá)呈現(xiàn)能力的評(píng)價(jià)方法
- 一種要圖計(jì)算機(jī)自動(dòng)評(píng)判方法
- 基于變權(quán)模糊綜合評(píng)判的北斗衛(wèi)星合格評(píng)判方法





