[發明專利]一種O2O商鋪食品安全監測方法有效
| 申請號: | 202011383623.3 | 申請日: | 2020-12-01 |
| 公開(公告)號: | CN112487145B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 王進;郝守迪;李馨渝;邱謙;閆振興;孫開偉;劉彬 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/216;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 o2o 食品安全 監測 方法 | ||
1.一種O2O商鋪食品安全監測方法,其特征在于,包括以下步驟:
S1、采用主動學習算法對某一店鋪的用戶歷史評論文本數據進行標注,得到標注樣本集L和未標注樣本集U;
采用主動學習算法進行人工標注包括:
S11、從網絡平臺上隨機獲取用戶歷史評論文本數據,隨機選擇獲取的部分用戶的歷史評論文本數據進行人工標注,標注1表明有食品安全隱患,標注0表明沒有食品安全隱患,剩下的部分用戶的歷史評論文本數據為未標注樣本集U;
S12、使用標注樣本集L訓練邏輯回歸模型,得到訓練好的邏輯回歸模型M;
S13、使用訓練好的邏輯回歸模型M對未標注樣本集U進行查詢函數計算,得到當前模型M不確定的樣本x*,對不確定的樣本x*進行人工標注,加入標注樣本集L中,重復以上步驟,直到不確定的樣本x*對應的表達式的值大于0.5為止,得到最終的標注樣本集L;
查詢函數的計算表達式如下:
其中,x*表示模型M對未標注樣本集U中最不確定的樣本,Q(U)表示查詢函數對未標注樣本集U進行計算,argmin表示取表達式的值最小時的參數,表示模型M對U中的樣本x的預測值;
S2、根據標注樣本集L構建詞向量;
標注樣本集L構建詞向量包括:
S21、將標注樣本集L中的文本分詞后輸入訓練好的ALBERT語言模型,ALBERT模型對每個分詞進行編碼,去掉ALBERT語言模型的輸出層,將ALBERT語言模型的最后一層編碼狀態進行平均池化后作為輸入詞的初始詞向量;
S22、將初始詞向量作為Word2Vec模型中隱藏層的初始化權重,再使用Word2Vec算法在用戶的歷史評論文本語料上進行訓練,得到最終的詞向量;
S3、將標注樣本集L輸入ELECTRA模型對模型參數進行微調,得到微調好的ELECTRA模型,將未標注樣本集U輸入微調好的ELECTRA模型中進行二分類,判別該店鋪是否存在食品安全隱患,如果存在食品安全隱患,則執行步驟S4;
ELECTRA模型包括判別器,所述判別器為Transformer結構,由24個結構完全相同的層堆疊而成,每一層作用是對輸入的序列狀態向量進行編碼;24個層被平均分為淺層、中間層和高層,淺層編碼文本表層特征,中間層編碼句法特征,高層編碼語義特征;
S4、將標注樣本集L和詞向量輸入AT-GRU模型中進行細粒度預測,計算評論中每個詞的注意力權重,取權重最大的詞作為該店鋪具體的食品安全隱患并輸出;
所述AT-GRU模型結構包括輸入層、嵌入層、GRU網絡層、注意力層和輸出層;
所述輸入層用于輸入數據;
所述嵌入層將構建的詞向量作為初始化的權重矩陣;
所述GRU網絡層對輸入的詞向量序列進行編碼,得到隱藏狀態序列S;
所述注意力層對GRU網絡層所有時間步的隱藏狀態序列S做加權平均,得到編碼向量h;
所述輸出層用于對注意力層的編碼向量h進行分類,最終輸出店鋪是否存在食品安全隱患。
2.根據權利要求1所述的一種O2O商鋪食品安全監測方法,其特征在于,注意力層對GRU網絡層所有時間步的隱藏狀態S做加權平均,得到編碼向量h,編碼向量h的計算表達式包括:
h=SγT
其中,注意力權重γ的計算方式如下:
D=ReLU(S)
其中,h表示注意力層編碼的向量,D表示對S的激活處理,S表示GRU層對輸入的詞向量序列的編碼,ReLU()表示修正線性單元函數,d表示隱藏狀態的維度,w表示一個d維度的可學習的參數列向量。
3.根據權利要求1所述的一種O2O商鋪食品安全監測方法,其特征在于,采用ELECTRA模型進行微調的微調方法包括:拼接ELECTRA模型中淺層、中間層和高層的編碼狀態,綜合編碼文本表層特征、句法特征、語義特征不同層次的信息,得到微調后的結果。
4.根據權利要求1所述的一種O2O商鋪食品安全監測方法,其特征在于,采用ELECTRA模型進行微調的微調方法包括:去掉原判別器的輸出層,將判別器的第6、12、18、24層的編碼狀態連接起來作為句子的向量表示,再輸入到一個隨機初始化參數的分類輸出層,然后將整個網絡的所有權重在訓練集上進行微調,最終輸出微調后的結果,計算表達式如下:
其中,表示模型的最終預測結果,即是否存在食品安全隱患,Concat表示連接操作,h6,h12,h18,h24分別是判別器第6、12、18、24層的隱藏狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011383623.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可移動式塑料管件批量化鉆孔機
- 下一篇:一種外接存儲設備的驗證方法及裝置





