[發(fā)明專利]基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010414176.7 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111782802A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設計)人: | 劉春雷;包江華;范超;杜長青;劉治軍 | 申請(專利權)人: | 北京極兆技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;G06N3/04;G06N3/08;G06Q30/06 |
| 代理公司: | 北京海虹嘉誠知識產(chǎn)權代理有限公司 11129 | 代理人: | 高麗萍 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 機器 學習 獲得 商品 對應 國民經(jīng)濟 制造業(yè) 方法 系統(tǒng) | ||
本發(fā)明涉及一種基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的方法及系統(tǒng),通過機器學習算法將千差萬別的具體商品歸一化到國家標準商品體系中的制造行業(yè)體系建立的商品知識圖譜數(shù)據(jù)庫中的最底層的分類中,并利用向量比較算法得到最底層的商品分類與國民經(jīng)濟制造業(yè)行業(yè)的底層分類之間的映射關系,并利用最底層的商品分類與映射關系迭代訓練能夠反映商品到國民經(jīng)濟制造業(yè)行業(yè)的映射關系的商品分類預測模型,由此得到的商品分類預測模型商品覆蓋面廣,完全覆蓋國家標準設計的幾千個最小的種類,并且利用了最先進的深度學習模型,預測效果極好;該商品分類預測模型將商品和國民經(jīng)濟制造業(yè)行業(yè)成功關聯(lián)起來,為其他相關的應用打下了很好的基礎。
技術領域
本發(fā)明屬于互聯(lián)網(wǎng)電子商務領域,具體涉及一種基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的方法及系統(tǒng)。
背景技術
互聯(lián)網(wǎng)發(fā)展迅猛,越來越多的商品通過電子商務進行銷售??焖?,準確地對所出售的商品進行類別的劃分顯得更加重要。商品分類是為了方便消費者購買的需要,將商品選擇適當?shù)姆诸悩酥?,系統(tǒng)地逐級分類。但是現(xiàn)有的分類方法多是基于統(tǒng)計或者簡單的機器學習技術,因此得到的分類效果不佳,或者能夠預測的分類個數(shù)有限,分類效果不好,并且分類后應用單一。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術存在的目前的現(xiàn)有的分類方法多是基于統(tǒng)計或者簡單的機器學習技術,因此得到的分類效果不佳,或者能夠預測的分類個數(shù)有限,分類效果不好,并且分類后應用單一的技術問題,本發(fā)明提供一種基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的方法,該方法利用機器學習算法將商品與國民經(jīng)濟制造業(yè)行業(yè)關聯(lián)起來,商品覆蓋范圍廣,利用深度學習模型,預測效果好,為相關應用打下了良好的基礎。本發(fā)明還涉及一種基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的系統(tǒng)。
本發(fā)明的技術方案如下:
一種基于機器學習獲得商品對應國民經(jīng)濟制造業(yè)的方法,其特征在于,所述方法包括如下步驟:
S1,采集有標簽的商品分類數(shù)據(jù)作為初始訓練樣本集利用機器學習算法訓練初始深度學習模型,所述初始深度學習模型為長短時記憶循環(huán)神經(jīng)網(wǎng)絡;
S2,利用所述初始深度學習模型對無標簽數(shù)據(jù)進行分類,根據(jù)分類結果對所述初始深度學習模型進行迭代訓練得到用于將商品進行底層類別分類的第一商品分類預測模型;
S3,根據(jù)國家標準商品體系中的制造行業(yè)體系建立商品知識圖譜數(shù)據(jù)庫,在所述商品知識圖譜數(shù)據(jù)庫中提取目標商品的文本格式商品數(shù)據(jù);利用所述第一商品分類預測模型根據(jù)機器學習算法對所述目標商品的文本格式商品數(shù)據(jù)進行歸一化分類得到文本格式底層商品分類數(shù)據(jù);再將所述文本格式底層商品分類數(shù)據(jù)轉變?yōu)閿?shù)值化的向量,利用向量比較算法判斷文本的相似性從而得出商品分類與國民經(jīng)濟制造業(yè)行業(yè)的映射關系;
S4,將所述文本格式底層商品分類數(shù)據(jù)與所述映射關系作為訓練樣本,對所述第一商品分類預測模型進行迭代訓練,得到用于反映商品到國民經(jīng)濟制造業(yè)行業(yè)的映射關系的第二商品分類預測模型;
S5,所述第二商品分類預測模型根據(jù)輸入的任一商品的文本格式的商品數(shù)據(jù)得到所述任一商品所對應的國民經(jīng)濟制造業(yè)行業(yè)。
進一步地,在步驟S3中,所述第一、第二商品分類預測模型均為長短時記憶循環(huán)神經(jīng)網(wǎng)絡。
進一步地,所述長短時記憶循環(huán)神經(jīng)網(wǎng)絡為雙向長短時記憶循環(huán)神經(jīng)網(wǎng)絡。
進一步地,在步驟S3中,所述將所述文本格式底層商品分類數(shù)據(jù)轉變?yōu)閿?shù)值化的向量,利用向量比較算法判斷文本的相似性從而得出商品分類與國民經(jīng)濟制造業(yè)行業(yè)的映射關系包括步驟:
S31,將所述文本格式底層商品分類數(shù)據(jù)中每一個類別中的每一個漢字或字符進行數(shù)值化編碼,得到每一個漢字或字符的300維度的向量表示,按照原始底層商品分類數(shù)據(jù)中的每一個類別中每一個漢字或字符的先后順序?qū)?shù)值化編碼后的每一個漢字或字符對應的向量依次進行矢量相加,分別得到各類別所對應的第一向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京極兆技術有限公司,未經(jīng)北京極兆技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010414176.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





