[發明專利]文本分類方法、裝置及設備有效
| 申請號: | 202010690569.0 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111737473B | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 王君吉;張朝勝;徐琪 | 申請(專利權)人: | 浙江口碑網絡技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/295;G06N3/08 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 310012 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 方法 裝置 設備 | ||
本申請公開了一種文本分類方法、裝置及設備,涉及文本分類技術領域,使得網絡平臺能夠準確對餐品描述信息所形成的文本進行分類,提高文本分類效果。其中方法包括:獲取對餐品描述信息進行處理后所形成的文本特征;將所述文本特征分別輸入至預先訓練具有不同網絡結構的文本分類模型中進行預測,得到文本特征映射的多個分類結果,所述文本分類模型用于預測文本特征在各個類目上的概率值,所述分類結果為預測得到概率值最高時對應文本特征的類目;通過統計所述文本特征映射的多個分類結果中類目的占比值,將占比值最高的類目確定為所述文本特征映射的最終分類結果。
技術領域
本申請涉及文本分類技術領域,尤其是涉及到一種文本分類方法、裝置及設備。
背景技術
隨著互聯網技術的不斷發展,網絡往早已成為現代人生活不可或缺的部分,網上訂餐由于其獨有的便捷性和直觀性而受到用戶的歡迎。為了便于用戶瀏覽,網絡平臺端會對線上實體對象提供的餐品描述信息進行分類整理,并將分類整理后的餐品描述信息投放至網絡平臺,進而在網絡平臺中展示餐品描述信息,以供用戶選取。
通常情況下,網絡平臺在對線上實體對象提供的餐品描述信息進行分類整理的過程可以轉行為對餐品描述信息中文本進行分類的過程,具體可以通過使用深度學習的分類算法來對餐品描述信息形成的文本進行分類,從而判斷出餐品對象所屬的類目。然而,針對同一個餐品對象,由于線上實體對象所經營的類型不同,該餐品對象在不同線上實體對象所屬的類目不同,例如,針對餐品“金針菇”而言,在燒烤實體對象中所屬類目“燒烤菌菇類”為,而在炒菜實體對象中所屬的類目為“菜品熱菜”,另外還有對于實體對象為了吸引用戶自命名的餐品,對于上述餐品對象類目劃分模糊以及文本命名規則不規范的餐品描述信息,僅通過餐品描述信息形成的文本可能很難去判別餐品對象所屬的類目,使得網絡平臺無法準確對餐品描述信息所形成的文本信息進行分類,導致文本分類效果不理想。
發明內容
有鑒于此,本申請提供了一種文本分類方法、裝置及設備,主要目的在于解決現有技術中網絡平臺無法準確對餐品描述信息所形成的文本進行分類,導致文本分類效果不理想的問題。
根據本申請的第一個方面,提供了一種文本分類方法,該方法包括:
獲取對餐品描述信息進行處理后所形成的文本特征;
將所述文本特征分別輸入至預先訓練具有不同網絡結構的文本分類模型中進行預測,得到文本特征映射的多個分類結果,所述文本分類模型用于預測文本特征在各個類目上的概率值,所述分類結果為預測得到概率值最高時對應文本特征的類目;
通過統計所述文本特征映射的多個分類結果中類目的占比值,將占比值最高的類目確定為所述文本特征映射的最終分類結果。
在本發明另一實施例中,所述具有不同網絡分類結果的文本分類模型中包括具有深度神經網絡結構的第一分類模型、具有淺層網絡結構的第二分類模型、具有卷積神經網絡結構的第三分類模型,所述將所述文本特征分別輸入至預先訓練具有不同網絡結構的文本分類模型中進行預測,得到文本特征映射的多個分類結果,具體包括:
將所述文本特征輸入至第一分類模型中進行預測,得到文本特征映射的第一分類結果;
將所述文本特征輸入至第二分類模型中進行預測,得到文本特征映射的第二分類結果;
將所述文本特征輸入至第三分類模型中進行預測,得到文本特征映射的第三分類結果。
在本發明另一實施例中,所述第一分類模型包括用于對文本特征中不同的描述特征進行預測的分類子模型,所述將所述文本特征輸入至第一分類模型中進行預測,得到文本特征映射的第一分類結果,具體包括:
通過分析所述文本特征描述對象的維度信息,將所述文本特征劃分為不同的描述特征;
確定所述不同的描述特征在第一分類模型所映射的分類子模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江口碑網絡技術有限公司,未經浙江口碑網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010690569.0/2.html,轉載請聲明來源鉆瓜專利網。





