[發明專利]貨源信息分類方法、裝置、電子設備、存儲介質有效
| 申請號: | 202011473251.3 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112418354B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 郁博文;張鵬 | 申請(專利權)人: | 江蘇滿運物流信息有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F40/284 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 潘一諾 |
| 地址: | 210012 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 貨源 信息 分類 方法 裝置 電子設備 存儲 介質 | ||
本發明提供一種貨源信息分類方法、裝置、電子設備、存儲介質,方法包括:基于規則匹配判斷待分類貨源信息是否為準有效信息;若是,則提取所述待分類貨源信息的特征獲得特征向量;將所述特征向量分別輸入至少兩個基學習器;將所述至少兩個基學習器的輸出輸入至一次學習器;以及根據所述次學習器的輸出,判斷所述待分類貨源信息是否為有效信息。本發明結合規則匹配以及分類模型算法,從而實現貨主發布的貨源信息的分類,以提高分類算法的泛化能力、容錯能力以及自學習和自適應能力,以實現非貨源信息的識別,從而能夠避免廣告信息、敏感信息、抱怨信息等與貨源無關的信息發布在平臺上。
技術領域
本發明涉及計算機技術領域,尤其涉及一種貨源信息分類方法、裝置、電子設備、存儲介質。
背景技術
隨著互聯網以及信息技術的發展,線上貨運平臺在貨主和司機之間已經越來越普及。貨主通過貨運平臺發布貨源信息,并由司機進行瀏覽和接單,以實現貨運前的對接過程。
在貨運平臺中,貨源信息由貨主輸入,并發布。經常有一些廣告或者辱罵抱怨,或者含有違禁關鍵詞的違規信息,平臺需要對這些發布的貨源信息進行管控,以免廣告信息、敏感信息、抱怨信息等與貨源無關的信息發布在平臺上。然而,人工識別的話耗時耗力,所以,通常會采用算法來解決這個問題。
然而,單純利用添加特殊規則識別會導致規則冗長,為了實現每一規則的匹配,還可能存在匹配時間過長的情況。同時,需要識別的情況過多,難以總結全面,由此,規則匹配的泛化能力和容錯能力不夠強,也沒有自學習和自適應能力。此外,若單純用單一類型的神經網絡來分類的話,因為網絡模型的逼近和泛化能力與我們訓練樣本的典型性相關度比較密切,而目前難以保證收集的訓練數據有典型性,并且某些神經網絡模型計算成本較高,在工業上難以起到學術界一樣卓越的效果。
由此,如何結合規則匹配以及分類模型算法,從而實現貨主發布的貨源信息的分類,以提高分類算法的泛化能力、容錯能力以及自學習和自適應能力,以實現非貨源信息的識別,從而能夠避免廣告信息、敏感信息、抱怨信息等與貨源無關的信息發布在平臺上,是本領域技術人員亟待解決的技術問題。
發明內容
本發明為了克服上述相關技術存在的缺陷,提供一種貨源信息分類方法、裝置、電子設備、存儲介質,進而至少在一定程度上結合規則匹配以及分類模型算法,從而實現貨主發布的貨源信息的分類,以提高分類算法的泛化能力、容錯能力以及自學習和自適應能力,以實現非貨源信息的識別,從而能夠避免廣告信息、敏感信息、抱怨信息等與貨源無關的信息發布在平臺上。
根據本發明的一個方面,提供一種貨源信息分類方法,包括:
基于規則匹配判斷待分類貨源信息是否為準有效信息;
若是,則提取所述待分類貨源信息的特征獲得特征向量;
將所述特征向量分別輸入至少兩個基學習器;
將所述至少兩個基學習器的輸出輸入至一次學習器;以及
根據所述次學習器的輸出,判斷所述待分類貨源信息是否為有效信息。
在本發明的一些實施例中,所述基于規則匹配判斷待分類貨源信息是否為準有效信息包括:
判斷所述待分類貨源信息中是否存在與關鍵詞集中字符一致和/或拼音一致的字段,所述關鍵詞集中包括多個預設定的禁用詞;
若是,則判斷所述待分類貨源信息為無效信息;
若否,則判斷所述待分類貨源信息為準有效信息。
在本發明的一些實施例中,所述基于規則匹配判斷待分類貨源信息是否為準有效信息包括:
判斷所述待分類貨源信息中是命中無效信息規則集合中的規則,所述無效信息規則集合中包括多個預設定的無效信息規則;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇滿運物流信息有限公司,未經江蘇滿運物流信息有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011473251.3/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





