[發(fā)明專利]一種基于隨機(jī)森林算法的自學(xué)習(xí)智能判定方法在審
| 申請?zhí)枺?/td> | 201910145429.2 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN109840281A | 公開(公告)日: | 2019-06-04 |
| 發(fā)明(設(shè)計)人: | 姜帥;欒麗麗;寧方剛;陳兆亮 | 申請(專利權(quán))人: | 浪潮軟件集團(tuán)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 濟(jì)南信達(dá)專利事務(wù)所有限公司 37100 | 代理人: | 闞恭勇 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 判定結(jié)果 分布統(tǒng)計 隨機(jī)森林 智能判定 統(tǒng)計分析 決策樹 自學(xué)習(xí) 算法 判定 自然語言處理技術(shù) 詞頻 準(zhǔn)確度 歷史數(shù)據(jù) 文本內(nèi)容 自我學(xué)習(xí) 分析 樹節(jié)點 無人工 剪枝 綜合分析 量化 輸出 干預(yù) 改進(jìn) | ||
本發(fā)明提供一種基于隨機(jī)森林算法的自學(xué)習(xí)智能判定方法,屬于自然語言處理技術(shù)領(lǐng)域,本發(fā)明通過分析歷史數(shù)據(jù)、自我學(xué)習(xí)和增加新的樹節(jié)點,可以不斷改進(jìn)判定的準(zhǔn)確度。本發(fā)明的方法通過詞頻分布統(tǒng)計分析、詞序分布統(tǒng)計分析、量化統(tǒng)計分析、規(guī)定條款統(tǒng)計分析等決策樹綜合分析判定文本內(nèi)容,可以用于各種判定結(jié)果的生成,通過合理的決策樹剪枝,實現(xiàn)了快速判定結(jié)果輸出,其無人工干預(yù)的特點有助于實現(xiàn)判定結(jié)果生成的公平、公正性。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù),尤其涉及一種基于隨機(jī)森林算法的自學(xué)習(xí)智能判定方法。
背景技術(shù)
隨機(jī)森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。隨機(jī)森林的優(yōu)點在于:對于很多種資料,它可以產(chǎn)生高準(zhǔn)確度的分類器;它可以處理大量的輸入變數(shù);學(xué)習(xí)過程是很快速的;在建造森林時,它可以在內(nèi)部對于一般化后的誤差產(chǎn)生不偏差的估計。
在日常的生產(chǎn)生活中,通過以國家的政策文件、規(guī)章制度、標(biāo)準(zhǔn)規(guī)范為基礎(chǔ),分析總結(jié)歷史經(jīng)驗進(jìn)行調(diào)整,進(jìn)而得出對于現(xiàn)有需判定問題的結(jié)論是一個常用且能夠被多數(shù)人認(rèn)同的方法。
發(fā)明內(nèi)容
根據(jù)以上內(nèi)容,本發(fā)明提出了一種基于隨機(jī)森林算法的自學(xué)習(xí)智能判定方法,模擬人類做出判定時的思維方式,可以智能分析輸入文本中的內(nèi)容,并將內(nèi)容轉(zhuǎn)換為匹配結(jié)果。
本發(fā)明所實現(xiàn)的判定方法最終部署為web服務(wù)方式,通過Rest接口獲取外部輸入的文本數(shù)據(jù)、分析文本中的語素,通過量化和非量化的分析得出相對應(yīng)的結(jié)論,通過自我學(xué)習(xí)對判定結(jié)果進(jìn)行修正。
本發(fā)明的技術(shù)方案是:
森林算法的自學(xué)習(xí)智能判定方法,其特征在于,
通過Rest接口獲取外部輸入的文本數(shù)據(jù),通過對自然語言的詞頻分布統(tǒng)計分析、詞序分布統(tǒng)計分析、量化統(tǒng)計分析、規(guī)定條款統(tǒng)計分析,綜合分析判定文本內(nèi)容,通過自我學(xué)習(xí)不斷修正判定結(jié)果,最終輔助決策者得出判定結(jié)果。
所述Rest接口獲取外部輸入,
采用Restful風(fēng)格接口獲取外部系統(tǒng)的請求數(shù)據(jù)并通過JSON格式返回響應(yīng)結(jié)果。
通過分析并統(tǒng)計文本中詞出現(xiàn)的次數(shù)生成詞頻統(tǒng)計數(shù)據(jù);
通過分析并統(tǒng)計文本中詞與詞之間的順序關(guān)系生成詞序統(tǒng)計網(wǎng)絡(luò);
通過分析文本中量化的數(shù)據(jù)及與其對應(yīng)的實體間的關(guān)系,生成量化統(tǒng)計數(shù)據(jù);
通過分析文本中的規(guī)定條款,生成規(guī)定條款統(tǒng)計數(shù)據(jù)。
所述詞頻分布統(tǒng)計,
通過分析歷史數(shù)據(jù),將歷史數(shù)據(jù)中的自然語言描述拆解為詞,統(tǒng)計各個歷史判定結(jié)果對應(yīng)的文本中各個詞出現(xiàn)的次數(shù),形成詞頻分布,最終將詞頻分布作為得出判定結(jié)果的一個條件,存入系統(tǒng)的知識庫中。
所述詞序分布統(tǒng)計,
通過分析歷史數(shù)據(jù),將歷史數(shù)據(jù)中的自然語言拆解為詞,根據(jù)各個歷史判定結(jié)果對應(yīng)的文本中的詞的順序關(guān)系構(gòu)建詞序分布網(wǎng)絡(luò),根據(jù)詞序關(guān)系出現(xiàn)的次數(shù)決定各個節(jié)點間的距離,最終將詞序分布作為得出判定結(jié)果的一個條件,存入系統(tǒng)的知識庫中。
所述量化統(tǒng)計,
通過分析歷史數(shù)據(jù),解析出歷史數(shù)據(jù)中的量詞與量詞描述的主體,將量化統(tǒng)計信息作為得出判定結(jié)果的一個條件,存入系統(tǒng)的知識庫中。
所述規(guī)定條款統(tǒng)計,
通過分析歷史數(shù)據(jù),解析出歷史數(shù)據(jù)中的規(guī)定條款信息,將規(guī)定條款信息作為得出判定結(jié)果的一個條件,存入系統(tǒng)的知識庫中。
所述判定結(jié)果得出,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮軟件集團(tuán)有限公司,未經(jīng)浪潮軟件集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910145429.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于條件隨機(jī)森林的笑臉檢測器及方法
- 隨機(jī)森林模型訓(xùn)練的方法及模型訓(xùn)練控制系統(tǒng)
- 隨機(jī)森林模型訓(xùn)練方法及裝置
- 基于結(jié)構(gòu)化隨機(jī)森林編碼器的眼底視網(wǎng)膜血管分割方法
- 一種基于隨機(jī)森林模型的慢性肝病風(fēng)險評估系統(tǒng)
- 基于改進(jìn)隨機(jī)森林方法的風(fēng)光發(fā)電出力的短期預(yù)測方法
- 交互式隨機(jī)森林子樹篩選方法、裝置、設(shè)備及可讀介質(zhì)
- 交互式隨機(jī)森林集成方法、設(shè)備及可讀存儲介質(zhì)
- 一種基于深度森林的眼底圖像血管分割方法和系統(tǒng)
- 隨機(jī)森林的生成方法、裝置、電子設(shè)備及存儲介質(zhì)





