[發明專利]用于數學題目語義解析的指代消解方法有效
| 申請號: | 201810964809.4 | 申請日: | 2018-08-23 |
| 公開(公告)號: | CN109325098B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 梅陽陽;謝德剛;鄭文娟 | 申請(專利權)人: | 上海互教教育科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F16/35 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 韋志剛 |
| 地址: | 201210 上海市浦東新區中國(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 數學 題目 語義 解析 指代 消解 方法 | ||
1.一種用于數學題目語義解析的指代消解方法,其特征在于,所述方法包括以下步驟:
S1:對不同的題目文本進行分類,提取每一類題目文本中所涉及到的基本實體;步驟S1具體包括根據初等數學課本中不同章節對數學題目文本進行分類,提取每一類題目文本中所涉及到的主要基本實體,均可作為指代問題中的候選實體;
S2:對給定的數學題目文本進行解析,如果解析成功,則判斷句子內是否存在指代問題;
S3:在指代過程中增加對候選實體的判斷,包括對實體所在句子的語法進一步判斷,找到準確的指代實體,再進行實體替換操作。
2.根據權利要求1所述的用于數學題目語義解析的指代消解方法,其特征在于,所述步驟S2進一步包括:
對數學題目文本的解析過程包括公式識別、分詞操作、非公式文本詞性標注以及公式的序列標注,解析成功后則根據詞性判斷文本中是否存在指代問題,其中,
數學題目文本中的公式采用CRF算法進行識別和序列標注,并使用詞典對數學題目文本中非公式部分進行分詞和詞性標注,這里,數學題目文本包括公式和非公式。
3.根據權利要求1所述的用于數學題目語義解析的指代消解方法,其特征在于,所述步驟S3具體包括以下步驟:
基于每一類別的題目均有不同的實體候選規則,找到每個句子中所有實體,根據是否屬于本類題目中主要實體而給每個題目文本中的實體賦予不同的可信度,
篩選出可信度較大的實體,并根據該實體的前后詞語、詞性和語法判斷該實體是否可以作為指代消解的實體,如果可以則加入候選集,并記錄該實體的位置,
對存在指代問題的數學題目中出現的代詞的詞組進行分析,確定代詞種類和指代數量。
4.根據權利要求3所述的用于數學題目語義解析的指代消解方法,其特征在于,
對代詞進行分析,初步明確指代實體的類別,再結合候選集,準確找到指代實體,再在代詞詞組所在位置進行實體替換操作,即指代消解操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海互教教育科技有限公司,未經上海互教教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810964809.4/1.html,轉載請聲明來源鉆瓜專利網。





