[發明專利]一種智能企業分類算法在審
| 申請號: | 201710573301.7 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN110019769A | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 趙亮 | 申請(專利權)人: | 元素征信有限責任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27;G06K9/62 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 王鵬 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 企業分類 算法 文本預處理 分類算法 描述文本 智能 分類 機器學習算法 分類準確率 產業分類 特征選取 自動分類 分類器 分詞 去除 | ||
1.一種智能企業分類算法,其特征在于,包括:文本預處理流程和分類算法;其中,
所述文本預處理流程包括如下步驟:(1)特征選取:選取合適的文本描述字段,一般選取企業的經營范圍描述字段,結合企業名稱來分析;(2)分詞:將中文文本分割成機器能夠處理的單詞,是一種處理中文常用的較為成熟的技術,且常用算法包括隱馬爾可夫模型;(3)去除停止詞:去掉無意義的虛詞、符號以及去掉有干擾的各個注釋,以避免對文本分類器引入不必要的噪聲;(4)選取有代表性的詞:根據TF-IDF算法將得到的詞進一步抽取,得到有代表性的詞;
所述分類算法為一機器學習算法,需要使用已有的有正確分類的數據對算法進行訓練,得到可靠的分類器對新的描述文本作出分類。
2.根據權利要求1所述的一種智能企業分類算法,其特征在于,所述分類算法使用的是線性核函數的SVM,將文本預處理得到的已有數據分為訓練集和交叉驗證集,參考模型在交叉驗證集上的表現,選取合適的模型參數,待確定好模型后對經過預處理的新的文本進行分類。
3.根據權利要求2所述的一種智能企業分類算法,其特征在于,所述SVM即支持向量機,是一個有監督的學習模型,通常用來進行模式識別、分類以及回歸分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于元素征信有限責任公司,未經元素征信有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710573301.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:生成文本摘要的方法及裝置
- 下一篇:訓練分類模型的方法與裝置





