[發(fā)明專利]基于nlp分類模型智能下發(fā)的方法、裝置以及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110702962.1 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113377715A | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計)人: | 張迎澤;喻波;王志海;韓振國 | 申請(專利權(quán))人: | 北京明朝萬達科技股份有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/176 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100142 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 nlp 分類 模型 智能 下發(fā) 方法 裝置 以及 存儲 介質(zhì) | ||
本發(fā)明提供一種基于nlp分類模型智能下發(fā)的方法、裝置以及存儲介質(zhì)。其中所述方法包括:將業(yè)務(wù)系統(tǒng)和nlp訓練服務(wù)系統(tǒng)的樣本文件和模型文件存放路徑做共享;業(yè)務(wù)系統(tǒng)導(dǎo)入和解析所述樣本文件,并將解析后的樣本文件的路徑發(fā)送給nlp訓練服務(wù)系統(tǒng),nlp訓練服務(wù)系統(tǒng)生成智慧模型文件;業(yè)務(wù)系統(tǒng)將智慧模型文件發(fā)送給nlp預(yù)測系統(tǒng),并重新加載nlp預(yù)測系統(tǒng)的預(yù)測服務(wù),使最新下發(fā)的智慧模型生效;通過調(diào)用所述預(yù)測服務(wù)的預(yù)測接口對外部文件進行分類。
技術(shù)領(lǐng)域
本發(fā)明涉及文檔智能分類分級技術(shù)領(lǐng)域,尤其是涉及一種基于nlp分類模型智能下發(fā)的方法、裝置以及存儲介質(zhì)。
背景技術(shù)
自然語言處理(NLP)是一種專業(yè)分析人類語言的人工智能,融合了語言學、計算機科學和機器學習的混合學科,支持文本實體抽取、文本分類、關(guān)鍵短語抽取、情感分析、關(guān)系抽取、商品評價解析,簡歷抽取和智能合同審查等NLP定制化算法能力,用戶無需擁有豐富的算法背景,僅需標注或上傳適量文檔數(shù)據(jù),即可通過平臺快速創(chuàng)建算法模型并使用。
公開號為CN110413769A公開了一種場景分類方法、裝置以及存儲介質(zhì)。該場景分類方法包括對用戶輸入的文本進行預(yù)處理;基于擴展詞庫對經(jīng)預(yù)處理的文本進行分詞以生成語料;將語料轉(zhuǎn)換為向量;以及使用卷積神經(jīng)網(wǎng)絡(luò)模型對向量進行處理以獲得與文本對應(yīng)的場景分類的概率針對nlp文檔分類分級技術(shù),目前市場上都是先通過收集樣本文件,對樣本文件進行訓練后生成智慧模型,通過拷貝智慧模型到預(yù)測器從而預(yù)測文件類別,當樣本文件積累到一定數(shù)量后再訓練生成模型來不斷提高模型準確率。
對于模型文件的拷貝、重啟預(yù)測器加載模型的步驟對于客戶來說操作起來會顯得很繁瑣,并且存在一定的安全隱患,為了提高客戶的工作效率保障客戶服務(wù)器環(huán)境的安全,有必要對處理流程進行優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于nlp分類模型智能下發(fā)的方法、裝置以及存儲介質(zhì),以解決現(xiàn)有技術(shù)中存在的技術(shù)問題。
本發(fā)明第一方面提供了一種基于nlp分類模型智能下發(fā)的方法,方法包括:
S1:將業(yè)務(wù)系統(tǒng)和nlp訓練服務(wù)系統(tǒng)的樣本文件和模型文件存放路徑做共享;
S2:業(yè)務(wù)系統(tǒng)導(dǎo)入和解析所述樣本文件,并將解析后的樣本文件的路徑發(fā)送給nlp訓練服務(wù)系統(tǒng),nlp訓練服務(wù)系統(tǒng)生成智慧模型文件;
S3:業(yè)務(wù)系統(tǒng)將智慧模型文件發(fā)送給nlp預(yù)測系統(tǒng),并重新加載nlp預(yù)測系統(tǒng)的預(yù)測服務(wù),使最新下發(fā)的智慧模型生效。
根據(jù)本發(fā)明第一方面提供的方法,所述方法還包括:
S4:通過調(diào)用所述預(yù)測服務(wù)的預(yù)測接口對外部文件進行分類。
根據(jù)本發(fā)明第一方面提供的方法,所述路徑做共享的方法為:nas存儲。
根據(jù)本發(fā)明第一方面提供的方法,所述解析所述樣本文件的方法為:tika文本解析工具。
根據(jù)本發(fā)明第一方面提供的方法,調(diào)用tika將所述樣本文件解析為txt文本文件。
根據(jù)本發(fā)明第一方面提供的方法,nlp訓練服務(wù)系統(tǒng)通過路徑共享的方式得到所述txt文本文件。
根據(jù)本發(fā)明第一方面提供的方法,所述業(yè)務(wù)系統(tǒng)將智慧模型文件發(fā)送給nlp預(yù)測系統(tǒng)之前,所述方法還包括:所述業(yè)務(wù)系統(tǒng)通過路徑共享的方式從nlp訓練服務(wù)系統(tǒng)得到所述智慧模型文件。
根據(jù)本發(fā)明第一方面提供的方法,所述將智慧模型文件發(fā)送給nlp預(yù)測系統(tǒng)的方法為:thrift文件流方式。
本發(fā)明第二方面提供了一種基于nlp分類模型智能下發(fā)的裝置,裝置包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明朝萬達科技股份有限公司,未經(jīng)北京明朝萬達科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110702962.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





