[發明專利]一種基于隨機森林算法的自學習智能判定方法在審
| 申請號: | 201910145429.2 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN109840281A | 公開(公告)日: | 2019-06-04 |
| 發明(設計)人: | 姜帥;欒麗麗;寧方剛;陳兆亮 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 闞恭勇 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 判定結果 分布統計 隨機森林 智能判定 統計分析 決策樹 自學習 算法 判定 自然語言處理技術 詞頻 準確度 歷史數據 文本內容 自我學習 分析 樹節點 無人工 剪枝 綜合分析 量化 輸出 干預 改進 | ||
1.一種基于森林算法的自學習智能判定方法,其特征在于,
通過Rest接口獲取外部輸入的文本數據,通過對自然語言的詞頻分布統計分析、詞序分布統計分析、量化統計分析、規定條款統計分析,綜合分析判定文本內容,通過自我學習不斷修正判定結果,最終輔助決策者得出判定結果。
2.根據權利要求1所述的方法,其特征在于,
所述Rest接口獲取外部輸入,
采用Restful風格接口獲取外部系統的請求數據并通過JSON格式返回響應結果。
3.根據權利要求1或2所述的方法,其特征在于,
通過分析并統計文本中詞出現的次數生成詞頻統計數據;
通過分析并統計文本中詞與詞之間的順序關系生成詞序統計網絡;
通過分析文本中量化的數據及與其對應的實體間的關系,生成量化統計數據;
通過分析文本中的規定條款,生成規定條款統計數據。
4.根據權利要求3所述的方法,其特征在于,
所述詞頻分布統計,
通過分析歷史數據,將歷史數據中的自然語言描述拆解為詞,統計各個歷史判定結果對應的文本中各個詞出現的次數,形成詞頻分布,最終將詞頻分布作為得出判定結果的一個條件,存入系統的知識庫中。
5.根據權利要求3所述的方法,其特征在于,
所述詞序分布統計,
通過分析歷史數據,將歷史數據中的自然語言拆解為詞,根據各個歷史判定結果對應的文本中的詞的順序關系構建詞序分布網絡,根據詞序關系出現的次數決定各個節點間的距離,最終將詞序分布作為得出判定結果的一個條件,存入系統的知識庫中。
6.根據權利要求3所述的方法,其特征在于,
所述量化統計,
通過分析歷史數據,解析出歷史數據中的量詞與量詞描述的主體,將量化統計信息作為得出判定結果的一個條件,存入系統的知識庫中。
7.根據權利要求3所述的方法,其特征在于,
所述規定條款統計,
通過分析歷史數據,解析出歷史數據中的規定條款信息,將規定條款信息作為得出判定結果的一個條件,存入系統的知識庫中。
8.根據權利要求3所述的方法,其特征在于,
所述判定結果得出,
綜合詞頻分布統計、詞序分布統計、量化統計、規定條款統計得出最終判定結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910145429.2/1.html,轉載請聲明來源鉆瓜專利網。





