[發明專利]代碼生成方法、裝置、電子設備及可讀存儲介質有效
| 申請號: | 202110605143.5 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113504906B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 李佳佳 | 申請(專利權)人: | 貝殼找房(北京)科技有限公司 |
| 主分類號: | G06F8/38 | 分類號: | G06F8/38;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 楊云云 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 代碼 生成 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種代碼生成方法,其特征在于,包括:
獲取目標前端網頁的網頁截圖以及與所述網頁截圖對應的網頁源代碼;
基于帶有注意力機制的卷積神經網絡視覺模型,提取所述網頁截圖的第一特征,并基于帶有注意力機制的語言處理網絡模型,提取所述網頁源代碼的第二特征;
融合所述第一特征和所述第二特征,獲取融合特征;
基于所述融合特征以及解碼模型,生成所述目標前端網頁的代碼;
所述帶有注意力機制的卷積神經網絡視覺模型為帶有注意力機制的U-Net深度網絡模型,所述帶有注意力機制的U-Net深度網絡模型采用卷積編碼-解碼架構,且所述卷積編碼-解碼架構中的解碼結構包含注意力機制模型;
相應的,所述基于帶有注意力機制的卷積神經網絡視覺模型,提取所述網頁截圖的第一特征,包括:
基于所述解碼結構中的注意力機制模型,生成門控信號,并將給定尺寸的卷積分別與激活函數ReLU和激活函數Sigmoid相結合,生成權重窗口;
基于所述門控信號,控制所述網頁截圖中不同空間位置處特征的權重,并基于所述權重窗口,抑制背景區域的特征響應,以提取所述第一特征。
2.根據權利要求1所述的代碼生成方法,其特征在于,還包括訓練所述帶有注意力機制的卷積神經網絡視覺模型、所述帶有注意力機制的語言處理網絡模型以及所述解碼模型的步驟:
獲取訓練樣本,并將所述訓練樣本對應的真實值代碼作為所述訓練樣本的標簽標注所述訓練樣本,所述訓練樣本包括網頁截圖樣本以及與所述網頁截圖樣本關聯的網頁源代碼樣本;
分別在初始卷積神經網絡視覺模型和初始語言處理網絡模型中加入注意力機制模型,獲取初始帶有注意力機制的卷積神經網絡視覺模型和初始帶有注意力機制的語言處理網絡模型;
將所述網頁截圖樣本輸入所述初始帶有注意力機制的卷積神經網絡視覺模型,并將所述網頁源代碼樣本輸入所述初始帶有注意力機制的語言處理網絡模型,以基于初始解碼模型預測前端網頁代碼;
比對預測的前端網頁代碼與所述真實值代碼,并基于所述比對確定的偏差,迭代更新網絡模型參數,以進行循環訓練,直至訓練完成,獲取所述帶有注意力機制的卷積神經網絡視覺模型、所述帶有注意力機制的語言處理網絡模型和所述解碼模型。
3.根據權利要求2所述的代碼生成方法,其特征在于,所述獲取訓練樣本,包括:
通過對標準訓練數據庫中的原始數據進行平移、旋轉或放縮,獲取第一訓練樣本集;
獲取給定前端網頁的多張網頁截圖,并基于所述多張網頁截圖的代碼邏輯,從所述多張網頁截圖中篩選出目標網頁截圖;
獲取與所述目標網頁截圖對應的網頁源代碼,并基于所述目標網頁截圖和所述目標網頁截圖對應的網頁源代碼,獲取第二訓練樣本集;
合并所述第一訓練樣本集和所述第二訓練樣本集,獲取樣本合集,并以所述樣本合集中的數據作為所述訓練樣本。
4.根據權利要求2所述的代碼生成方法,其特征在于,所述帶有注意力機制的語言處理網絡模型為帶有注意力機制的長短期記憶模型;
相應的,通過循環訓練,獲取所述帶有注意力機制的長短期記憶模型,包括:
獲取初始帶有注意力機制的長短期記憶模型中編碼器對所述網頁源代碼樣本的中間輸出結果;
利用注意力機制模型對所述中間輸出結果進行選擇性的學習,并關聯所述注意力機制模型的輸出權重序列與所述中間輸出結果,循環訓練所述注意力機制模型,直至訓練完成,獲取所述帶有注意力機制的長短期記憶模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貝殼找房(北京)科技有限公司,未經貝殼找房(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110605143.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種易加工高強鋼及其生產方法
- 下一篇:一種用于研究塑料生物降解的實驗裝置





