[發明專利]一種基于標準答案的知識點自動提取方法及系統在審
| 申請號: | 201710272107.5 | 申請日: | 2017-04-24 |
| 公開(公告)號: | CN107169043A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 王慶先 | 申請(專利權)人: | 成都準星云學科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N5/04 |
| 代理公司: | 北京卓唐知識產權代理有限公司11541 | 代理人: | 唐海力 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標準答案 知識點 自動 提取 方法 系統 | ||
1.一種基于標準答案的知識點自動提取方法,其特征在于包括如下步驟:
對題目和對應的標準答案進行自然語言理解,結果作為源知識集,
將所述源知識集放入一推理機中,并根據規則庫使用drools規則引擎訓練得到一知識庫,
根據所述知識庫依次對所述標準答案中的每個解答步驟進行比較,提取并標記出知識點。
2.根據權利要求1所述的知識點自動提取方法,其特征在于,對題目和對應的標準答案進行自然語言理解具體包括:
2-1)實體標注,將題目和對應的標準答案到的文本中實體用事先定義的符號標記,作為統一文本形式的模板,
2-2)模板匹配,對所述模板按照同一類型構成同一個XML文件。
3.根據權利要求1所述的知識點自動提取方法,其特征在于,將所述源知識集放入一推理機中后還包括如下的步驟:
3-1)定義實體與關系兩個概念,
3-2)基于包括已知事實和規則的產生式規則引擎,
3-3)通過所述產生式規則引擎訓練一知識庫。
4.根據權利要求3所述的知識點自動提取方法,其特征在于,所述推理機中的推理規則包括:
4-1)將給定的已知事實插入到事實庫中;
4-2)利用模式匹配對規則庫中的規則和事實庫中的已知事實進行匹配;
4-3)若多個所述規則同時滿足條件且處于激活狀態,則存在沖突性規則,同時將沖突的所有規則放入沖突集合中;
4-4)將用以處理激活狀態的規則按設定順序放入所述沖突集中并處理沖突;
4-5)利用執行引擎執行所述沖突集中的規則,重復以上步驟4-2)至4-4),直至所述沖突集沒有處于激活狀態的規則。
5.根據權利要求1所述的知識點自動提取方法,其特征在于,根據所述知識庫依次對所述標準答案中的每個解答步驟進行比較的方法如下:
源知識集中的經過自然語言理解處理后的標準答案的文本作為知識與知識庫中的內容作比較;
若所述標準答案的文本是題干中的已知條件,則不作處理;
若所述標準答案的文本是由已知條件推導而來,則在知識庫中查找每個關系所對應的條件集及規則名;
若標準答案推導過程中所用的條件與知識庫中的查找到的條件相匹配,則將知識庫中對應的規則名提取出來自動標注為知識點。
6.根據權利要求5所述的知識點自動提取方法,其特征在于,若所述標準答案的文本作為知識存在,則查找該知識的父親節點,將所述知識庫中推導出該知識的條件集,同時獲取推導出該知識規則的知識點并進行標記,如果該知識不存在,則該步驟不標記。
7.根據權利要求6所述的知識點自動提取方法,其特征在于,若所述標準答案的文本作為知識存在,而對同一知識由不同的條件集產生,則在所述知識庫中每一個知識節點有兩個屬性,一個是條件集即該知識節點的父親節點;另一個是規則名即推理出該知識所對應的知識點,則,選取所述知識庫中與當前答案的文本中上一步等價的條件集作為當前知識的父親結點進行推理,獲取與該條件集同組的規則名作為知識點進行標記。
8.一種基于標準答案的知識點自動提取系統,其特征在于,包括:知識采集單元、知識處理單元以及知識點提取單元,
所述知識采集單元,用以對題目和對應的標準答案進行自然語言理解,結果作為源知識集,
所述知識處理單元,用以將所述源知識集放入一推理機中,并根據規則庫使用drools規則引擎訓練得到一知識庫,
所述知識點提取單元,用以根據所述知識庫依次對所述標準答案中的每個解答步驟進行比較,提取并標記出知識點。
9.根據權利要求8所述的知識點自動提取系統,其特征在于,所述知識處理單元還用以,將所述知識庫通過設定規則集約束增加其知識數目,直到不再有新的規則被觸發即不再有新的知識產生則結束推理過程。
10.根據權利要求8所述的知識點自動提取系統,其特征在于,所述知識點提取單元,還用以將源知識集中的經過自然語言理解處理后的標準答案的文本作為知識與知識庫中的內容作比較;
若所述標準答案的文本是題干中的已知條件,則不作處理;
若所述標準答案的文本是由已知條件推導而來,則在知識庫中查找每個關系所對應的條件集及規則名;
若標準答案推導過程中所用的條件與知識庫中的查找到的條件相匹配,則將知識庫中對應的規則名提取出來自動標注為知識點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都準星云學科技有限公司,未經成都準星云學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710272107.5/1.html,轉載請聲明來源鉆瓜專利網。





