[發明專利]基于文本描述匹配的服裝面料樣品檢索方法有效
| 申請號: | 201910484107.0 | 申請日: | 2019-06-05 |
| 公開(公告)號: | CN110472108B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 周俊妍;薛文良;劉蘊瑩;丁亦;錢競芳 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F16/906 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文本 描述 匹配 服裝面料 樣品 檢索 方法 | ||
1.一種基于文本描述匹配的服裝面料樣品檢索方法,其特征在于,包括以下步驟:
1)文本描述信息標準化處理,完成信息分類
對用戶提供的需求描述文本信息進行標準化處理,將標準化字段分為兩類:第一類是檢索類字段,即用戶直接給出的可以通過簡單文本匹配的方式檢索的需求信息;第二類是預測類字段,將其輸入神經網絡,從而預測面料結構參數;
2)以檢索類字段為搜索對象,搜索面料數據庫,抽取面料待選集合,其中,提取檢索類字段與面料數據庫相應字段,匹配面料樣品,包括以下步驟:
檢索類字段由字符串與數值格式混合組成,其中字符串形式的字段匹配方式包括計算字符串相似度,若相似度低于閾值,則計算語義相似度,若相似度高于閾值,則基于Hownet中文詞知識樹,調用相關API接口完成相似度匹配,其中,字符串相似度是通過計算字段間相同的漢字數目來表征兩字段的相似度,從而實現快速匹配,字段fi與字段fj的相似度表示為Sim(fi,fj),則有:
式中,Numsame指段fi與字段fj相同字符串的個數,Numi指字段fi的字符串長度,Numj指字段fj的字符串長度
3)將預測類字段輸入神經網絡預測模型,輸出對應的面料結構參數,包括以下步驟:
步驟1、定義神經網絡預測模型的輸入數據X及輸出數據Y,其中:
輸入數據X是用戶描述中的預測類字段,預測類字段以織物的內在風格描述為主,包括光滑度、懸垂度、柔軟度以及光澤度四個指標,輸入數據X以矩陣的形式輸入;
輸出數據Y有兩類,第一類是離散類數據,包括面料成分、織造方式與織造工藝;第二類是連續類數據,包括織物密度、織物克重、紗支;對離散類數據而言,通過標簽的形式自動標注,采用獨熱編碼的方式進行量化;
步驟2、構建神經網絡預測模型后,利用樣本對神經網絡預測模型進行訓練,訓練時每個樣本重復進行步驟201至步驟203,經過多次迭代后,直到代價函數J(W,b)的值下降到閾值之下,停止訓練,保存神經網絡預測模型
步驟201、向前傳播,向前傳播的過程中利用sigmoid激活函數;
步驟202、利用交叉熵函數計算網絡的代價函數J(W,b)的值;
步驟203、向后傳播,向后傳播的目的是為了計算梯度,更新權重,從而降低代價函數J(W,b)的值;
步驟3、輸入預測類字段,輸出面料結構參數預測結果
將預測類字段按照輸入數據說明整理,以矩陣形式輸入神經網絡預測模型,保存實際面料結構參數預測結果;
4)以面料結構參數預測結果為搜索對象,搜索面料待選集合,返回面料推薦結果,其中,搜索方式針對不同格式的結構參數有所不同:
針對連續類結構參數:
提取預測得到的面料連續類結構參數,設定浮動閾值范圍,遍歷面料待選集合,搜索結構參數在范圍內的面料樣本,輸出面料推薦集合R1;
針對離散類結構參數:
將獨熱編碼形式的離散類結構參數轉換為標簽形式,繼而轉換為文本形式,按照檢索類字段的檢索方式遍歷面料待選集合,輸出面料推薦集合R2;
選擇R1與R2的并集作為最后結果輸出。
2.根據權利要求1所述的一種基于文本描述匹配的服裝面料樣品檢索方法,其特征在于,步驟2中,所述神經網絡預測模型采用三層神經網絡架構,權重初始化采用隨機初始化的方式,第一層是輸入層,設置4個神經元,包含光滑度、懸垂度、柔軟度以及光澤度這四個特征;第二層是隱含層,根據網絡模型訓練結果調整神經元個數n;第三層是輸出層,神經元個數與輸出數據類型有關,若輸出數據為連續類數據,則輸出層設置3個神經元,包括織物密度、織物克重、紗支;若輸出數據為離散類數據,則輸出層神經元個數設置與該離散類字段的詳細內容的個數相同。
3.根據權利要求1所述的一種基于文本描述匹配的服裝面料樣品檢索方法,其特征在于,步驟201中,sigmoid激活函數g(x)的公式如下:
式中,x表示輸入數據;
第l層的線性計算值Z[]與激活值A[l]計算公式如下:
Z[l]=W[l]A[l-1]+b[l]
A[l]=g(Z[l])
式中,W[l]、b[l]指第l層的權重,g(Z[l])指第l層的激活值,第l-1層的激活值是第l層的輸入值,除了當l=1時,A[0]即原始輸入X,由此計算所述神經網絡預測模型的實際輸出值即輸出層的激活值,記為
步驟202中,所述代價函數J(W,b)為:
式中,m指樣本數,y(i)指第i個樣本的理論輸出值,指第i個樣本的實際輸出值;
步驟203中,梯度的計算公式如下:
dZ[l]=dA[l]*g′(Z[l])
dA[l-1]=W[l]TdZ[l]
式中,dZ[l]、dW[l]、db[l]、dA[l-1]分別指代價函數J(W,b)對第l層線性計算值Z[l]求導;代價函數J(W,b)對第l層權重W[l]求導;代價函數J(W,b)對第l層權重b[l]求導;代價函數J(W,b)對第l-1層激活值A[l-1]求導;A[l-1]T指第l-1層激活值矩陣的轉置,Z[l](i)指第l層中第i個樣本的線性計算值,W[l]T指第l層W權重矩陣的轉置,通過計算每一層的dW[l]與db[l],更新每一層權重矩陣W[l]、b[l],公式如下:
W[l]=W[l]-αdW[l]
b[l]=b[l]-αdb[l]
式中,α指學習率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910484107.0/1.html,轉載請聲明來源鉆瓜專利網。





