[發明專利]一種虛假交易信息識別方法有效
| 申請號: | 201310037691.8 | 申請日: | 2013-01-31 |
| 公開(公告)號: | CN103064987A | 公開(公告)日: | 2013-04-24 |
| 發明(設計)人: | 王永康;張愛華 | 申請(專利權)人: | 五八同城信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 田俊峰 |
| 地址: | 300457 天津市濱海新區第一*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 虛假 交易 信息 識別 方法 | ||
技術領域
本發明涉及互聯網技術領域,特別是涉及一種虛假交易信息識別方法。
背景技術
隨著互聯網的發展,網上的信息變得越來越泛濫,越來越真假難辨。對于電子商務或分類信息等類型的網站,如果能夠為用戶提供安全、真實的商品信息,已經成為一項重要而又基本的內容,于是如何識別用戶發布信息的真假已經成為了確保信息安全的關鍵,這也是很多網站都面臨的問題。
在識別虛假交易信息上,目前的方法主要是通過人工的審核,外加一些技術手段,例如確定黑名單的IP(Internet?Protocol,網絡之間互連的協議)地址、確定發布的信息內容或格式不合法、價格區間不合法等將完全確定信息不合法的信息刪除。
現有策略的缺點是:人工審核太消耗人力、輔助的技術手段只能刪除少部分的虛假交易信息,還有大量的虛假交易信息逃脫,可以刪除100%確定為虛假的信息,但是對有85%可能為假的信息無能為力,因為都不能判斷信息為假的程度。
發明內容
本發明要解決的技術問題是提供一種虛假交易信息識別方法置,用以解決現有技術進行虛假交易信息識別上人工消耗大、虛假交易信息識別率低的問題。
為解決上述技術問題,一方面,本發明提供一種虛假交易信息識別方法,包括:
步驟S101,獲取用戶發布信息的信息特征、信息內容和/或圖片信息;
步驟S201,根據用戶發布信息的信息特征、信息內容和/或圖片信息,對用戶發布消息進行虛假交易信息識別。
進一步,在獲取用戶發布信息的信息特征之前,包括以下步驟:
步驟S1011,獲取之前用戶發布消息的基本數據;
步驟S1012,根據獲取的之前用戶發布消息的基本數據,提取訓練數據,確定正負樣本;
步驟S1013,對正負樣本中的數據進行特征轉換,得到設定數據格式的數據;
步驟S1014,根據設定數據格式的數據,建立回歸模型。
進一步,步驟S1013具體包括:
將正負樣本中的每條數據的特征確定為數值型或枚舉型兩類;
數值型的維度值不變,在數值型數據處于樣本中的位置處置該數值型數據的數值;
枚舉型的維度值先計算其md5值,然后將md5值對W取模,得到取模結果;在樣本中將處于取模結果位置的數值置1。
進一步,步驟S1014具體包括:
將步驟S1013得到的設定數據格式的數據轉化為稀疏矩陣;
在模型訓練程序中輸入產生的稀疏矩陣(x1,x2,x3,x4,x5,……,xp),p為設定數據格式的數據的數據量;得到每一條記錄對應的參數(β0,β1,β2,β3,β4,β5,……,βp);
建立回歸模型,回歸模型為:其中g(x)=β0+β1x1+β2x2+…+βpxp。
進一步,在建立回歸模型之后,當接收到用戶發布信息時,則步驟S101具體為:
步驟S1015,獲取用戶發布消息的基本數據;包括提取用戶發布消息的基本特征和獲取元特征;基本特征與元特征一起作為挖掘的基本數據。
進一步,在獲取用戶發布消息的基本數據之后,步驟S201具體包括以下步驟:
步驟S2011,對獲取用戶發布消息的基本數據進行特征轉換,得到模型可處理的數據格式;
步驟S2012,將步驟S2011得到的數據轉化為稀疏矩陣的形式,通過回歸模型進行虛假消息識別;其中,P>M,則Y=1,表示用戶發布信息為真實交易信息;反之,P≤M,則Y=0,表示用戶發布信息為虛假交易信息,M是預先設定的閾值。
進一步,在獲取用戶發布信息的信息內容之前,包括以下步驟:
步驟S1021,獲取之前用戶發布消息的信息內容并進行審核,將通過審核與沒通過審核的信息分為兩類,作為分類的樣本數據;
步驟S1022,對樣本中的信息內容進行分詞;
步驟S1023,通過計算,抽取特征詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于五八同城信息技術有限公司,未經五八同城信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310037691.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鉆井液分析裝置
- 下一篇:基于單束光分束的激光誘導擊穿光譜分析裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





