[發明專利]一種基于人工智能的產品三維展示方法及裝置在審
| 申請號: | 201810406212.8 | 申請日: | 2018-04-30 |
| 公開(公告)號: | CN108765549A | 公開(公告)日: | 2018-11-06 |
| 發明(設計)人: | 程昔恩;杜姍姍 | 申請(專利權)人: | 程昔恩 |
| 主分類號: | G06T17/00 | 分類號: | G06T17/00;G06T15/00;G06N3/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 333000 江西省景德*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 三維圖像 三維展示 渲染 人工智能 視頻 人工神經網絡 人工智能技術 信息處理技術 三維CAD模型 便攜設備 模型生成 視點信息 學習訓練 有效解決 拍攝 低成本 數據集 再利用 真實感 建模 手機 視點 圖像 | ||
1.一種基于人工智能的產品三維展示方法,其特征在于,所述基于人工智能的產品三維展示方法包括:
通過人工神經網絡建模三維圖像渲染模型,接著根據人工智能的學習訓練方法利用數據集對所述三維圖像渲染模型進行一次訓練,然后再利用用戶拍攝的某一產品的視頻或圖像對三維圖像渲染模型進行二次訓練,最終獲得針對該產品的三維圖像渲染模型。
2.如權利要求1所述基于人工智能的產品三維展示方法,其特征在于,所述基于人工智能的產品三維展示方法具體包括:
步驟一、構建人工神經網絡近似建模的三維圖像渲染模型;
步驟二、利用三維圖像渲染模型及三維圖像渲染模型對應圖像構成的訓練數據集以人工智能的學習訓練方法對所述三維圖像渲染模型進行訓練,獲取經過一次訓練的三維圖像渲染模型;
步驟三、獲取用戶圍繞產品拍攝的視頻或圖像;
步驟四、利用當前產品的圖像數據對所述的一次訓練的三維圖像渲染模型進行二次訓練,獲取產品調優的三維圖像渲染模型;
步驟五、獲取用戶請求的任意視點信息,將之輸入三維圖像渲染模型,獲取所述產品在當前視點的三維圖像。
3.如權利要求2所述基于人工智能的產品三維展示方法,其特征在于,
在步驟一中,使用包含多種隱層的組合架構的人工神經網絡來近似建模三維圖像渲染模型;
三維圖像渲染模型包括第一輸入層、第一卷積層組、第二輸入層、第一上采樣層組、第一殘差網絡塊組、第二上采樣層組、第一輸出層、第三輸入層、第二卷積層組、第二殘差網絡塊組、第三上采樣層組、第二輸出層;以與請求視點相關的視點圖像作為三維圖像渲染模型的第一輸入層并以請求視點信息作為三維圖像渲染模型的第二輸入層,所述第一輸入層輸入數據經過所述第一卷積層組處理后,與所述第二輸入層輸入數據經第一上采樣層處理后的數據共同經所述第一殘差網絡塊組處理,并經所述第二上采樣層組處理后在所述第一輸出層獲得輸出結果;以第一輸出層的輸出結果的融合結果作為第三輸入層,所述第三輸入層輸入數據經所述第二卷積層組、所述第二殘差網絡塊組、所述第三上采樣層組處理后,在所述第三輸出層獲得輸出結果,第三輸出層的輸出結果為三維圖像渲染模型的輸出數據。
4.如權利要求2所述基于人工智能的產品三維展示方法,其特征在于,在步驟二中, 利用ShapeNet構建的數據集,為:
其中,表示給定模型在任一視點下的三維圖像,表示指定的視點信息,表示給定模型在視點下的三維圖像,表示由給定模型在視點下距離視點虛擬相機的距離信息構成的深度圖,表示圖像的像素在圖像中的可見性,表示數據集中訓練樣本的個數;
在步驟二中,通過學習訓練獲取一次訓練的三維圖像渲染模型的學習訓練過程在將三維圖像渲染模型按網絡架構分成兩個子網絡:第一子網絡和第二子網絡,首先通過人工智能的學習訓練方法訓練第一子網絡,接著訓練第二子網絡,最后對整個網絡進行聯合調優;
在步驟二中,通過訓練獲取三維圖像渲染模型的第一子網絡的訓練過程在于通過人工智能的學習訓練使得第一子網絡的的輸出數據能最小化第一損失函數;
第一損失函數如下:
其中,第一子網絡的輸入是 ,表示第一子網絡輸出的圖像,表示第一子網絡輸出的深度信息,表示第一子網絡輸出的圖像的像素在圖像中的可見性, 是定義損失項權重的常數系數;
在步驟二中,通過訓練獲取三維圖像渲染模型的第二子網絡的訓練過程在于通過人工智能的學習訓練使得第二子網絡的的輸出數據能最小化第二損失函數;
所述第二損失函數如下:
其中,表示所述第二子網絡的輸入數據,表示所述第二子網絡的輸出數據,由圖像判別模型定義,為使得圖像判別模型能區分輸入是給定視角信息下的產品訓練圖像,為使第二子網絡輸出數據能夠欺騙圖像判別模型,為使第二子網絡的輸出數據的圖像特征和給定視角信息下的產品訓練圖像的圖像特征一致, 表示在圖像判別模型的第層提取圖像特征;
所述圖像判別模型由卷積神經網絡近似建模,所述圖像判別模型包括輸入層、第一卷積層、第二卷積層、第三卷積層、第四卷積層、全連接層,以訓練樣本中的產品三維圖像或第二子網絡的輸出數據作為輸入,所述輸入經過所述輸入層、所述第一卷積層、所述第二卷積層、所述第三卷積層、所述第四卷積層、所述全連接層后輸出數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于程昔恩,未經程昔恩許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810406212.8/1.html,轉載請聲明來源鉆瓜專利網。





