[發明專利]一種虛假地址識別方法、裝置及設備在審
申請號: | 201910362906.0 | 申請日: | 2019-04-30 |
公開(公告)號: | CN110197284A | 公開(公告)日: | 2019-09-03 |
發明(設計)人: | 鄺展豪 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
主分類號: | G06N20/00 | 分類號: | G06N20/00;G06Q30/06 |
代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;賈允 |
地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 地址識別 裝置及設備 分類模型 特征提取 特征信息 修正信息 虛假地址 語言模型 詞向量 預處理 地址對應 序列輸入 準確率 構建 輸出 分類 響應 | ||
本發明涉及一種虛假地址識別方法、裝置及設備,所述方法包括:預先構建地址識別模型,所述地址識別模型包括:語言模型和分類模型;響應于地址識別請求,所述地址識別請求包括待識別地址的名稱,生成所述待識別地址的詞向量序列;將所述詞向量序列輸入到所述語言模型中進行特征提取,得到與所述待識別地址對應的特征信息,以及修正信息;將所述特征信息和所述修正信息輸入到所述分類模型,得到所述待識別地址的識別結果。本發明通過依次對待識別地址進行預處理、特征提取以及分類輸出,得到了待識別地址的識別結果,提高了地址識別的效率和準確率,降低了識別成本。
技術領域
本發明涉及機器學習技術領域,尤其涉及一種虛假地址識別方法、裝置及設備。
背景技術
隨著電商黃牛日益猖狂,電商平臺以及品牌商蒙受的損失越來越大,大部分黃牛使用的手段是下單時收件地址填寫一個無法正常派送的虛假地址,待快遞員派件時由于虛假地址無法正常派送,黃牛與派件員電話溝通后,讓快遞員將貨物派送到真正的地址,從而達到囤貨的目的。黃牛這樣做是由于黃牛用于囤貨的真實地址有大量同類商品集聚的嫌疑,為防止電商平臺將真正用于囤貨的地址列入黑名單,黃牛設計出一系列虛假地址來繞過各大電商平臺的風控檢測。
虛假地址會有一些共性,通過人工大量的標注,利用監督式機器學習是能識別出虛假地址,但由于地址標注需要大量人力物力,而且黃牛會不斷設計出新型的虛假地址,所以基于大量人工打標簽的監督式學習并不適合電商平臺虛假地址識別的場景。
發明內容
本發明所要解決的技術問題在于,提供一種虛假地址識別方法、裝置及設備,能夠通過無監督訓練與有監督訓練相結合的方式訓練出虛假地址識別模型,并采用該識別模型對待識別的地址進行識別,提高對虛假地址識別的效率和準確率,降低識別成本。
為了解決上述技術問題,第一方面,本發明提供了一種虛假地址識別方法,所述方法包括:
預先構建地址識別模型,所述地址識別模型包括:語言模型和分類模型;
響應于地址識別請求,所述地址識別請求包括待識別地址的名稱,對所述待識別地址的名稱進行按字分割,生成與每個字相對應的詞向量,根據所述待識別地址中各個字的詞向量,生成所述待識別地址的詞向量序列;
將所述詞向量序列輸入到所述語言模型中進行特征提取,得到與所述待識別地址對應的特征信息,以及在特征提取過程中對所述待識別地址的修正信息;
將所述特征信息和所述修正信息輸入到所述分類模型,得到所述待識別地址的識別結果。
第二方面,本發明提供了一種虛假地址識別裝置,所述裝置包括:
識別模型構建模塊,用于預先構建地址識別模型,所述地址識別模型包括:語言模型和分類模型;
詞向量生成模塊,用于響應于地址識別請求,所述地址識別請求包括待識別地址的名稱,對所述待識別地址的名稱進行按字分割,生成與每個字相對應的詞向量,根據所述待識別地址中各個字的詞向量,生成所述待識別地址的詞向量序列;
特征提取模塊,用于將所述詞向量序列輸入到所述語言模型中進行特征提取,得到與所述待識別地址對應的特征信息,以及在特征提取過程中對所述待識別地址的修正信息;
分類識別模塊,用于將所述特征信息和所述修正信息輸入到所述分類模型,得到所述待識別地址的識別結果。
第三方面,本發明實施例提供了一種設備,所述設備包括處理器和存儲器,所述存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由所述處理器加載并執行以實現如第一方面所述的虛假地址識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362906.0/2.html,轉載請聲明來源鉆瓜專利網。