[發明專利]一種語塊重組題型的自動命題的方法及裝置有效
| 申請號: | 202110559261.7 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113361238B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 殷曉君 | 申請(專利權)人: | 北京語言大學 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F40/253;G06Q50/20 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 重組 題型 自動 命題 方法 裝置 | ||
1.一種語塊重組題型的自動命題的方法,其特征在于,所述方法包括:
獲取待切分語句以及切分塊數K;
通過預設的分詞算法對所述待切分語句進行分詞,得到所述待切分語句對應的M個詞語,所述M個詞語對應M-1個切分位,所述M-1大于所述K-1;
分別計算所述M個詞語中每兩個詞語之間的前鏈接概率以及后鏈接概率,計算所述M-1個切分位中每個切分位對應的切分合理性得分;
將所述M-1個切分位分別對應的切分合理性得分進行降序排列,選取前N個切分合理性得分對應的切分位,其中,所述N大于所述K-1;
在所述N個切分合理性得分對應的切分位中選取K-1個切分位作為最終切分位組合;
根據所述最終切分位組合,對所述待切分語句進行切分,并將切分后得到的K個語塊亂序輸出;
其中,所述計算所述M-1個切分位中每個切分位對應的切分合理性得分,包括:
對于所述M-1個切分位中每個切分位,基于切分位對應的兩個詞語的前鏈接概率以及后鏈接概率,通過下述公式(1),確定切分位對應的切分合理性得分:
slot_split_score=log(1-PLeft)+log(1-PRight)……(1)
其中,slot_split_score表示切分位對應的切分合理性得分,PLeft表示切分位對應的兩個詞語之間的前鏈接概率,PRight表示切分位對應的兩個詞語之間的后鏈接概率;
其中,所述在所述N個切分合理性得分對應的切分位中選取K-1個切分位作為最終切分位組合,包括:
在所述N個切分合理性得分對應的切分位的詞語中不重復地選取K-1個切分位,得到種切分位的組合;
對于種切分位的組合中的每種組合,確定對應的選取合理性分數;
確定多個選取合理性分數中的最大值,將所述最大值對應的組合確定為最終切分位組合;
其中,所述確定對應的選取合理性分數,包括:
計算組合中的所有切分位對應的切分合理性得分的和值split_score;
將組合中的所有切分位輸入預設的語言模型,得到多個順序對應的混淆評分,確定多個混淆評分中的最大值作為組合對應的混淆評分lm_score;
通過下述公式(2)計算組合對應的選取合理性分數:
score=w1*split_score+w2*lm_socre……(2)
其中,score表示組合對應的選取合理性分數,w1表示預設的切分合理性得分對應的權重系數,w2表示預設的混淆評分對應的權重系數。
2.根據權利要求1所述的方法,其特征在于,所述分別計算所述M個詞語中每兩個詞語之間的前鏈接概率以及后鏈接概率,包括:
獲取考試語言能力相關的大數據;
基于所述大數據,統計兩個詞語之間的前鏈接概率PLeft(W_j|W_i)以及后鏈接概率PRight(W_j|W_i),得到詞語之間的前鏈接概率對照表以及后鏈接概率對照表;
根據所述前鏈接概率對照表,確定所述M個詞語中每兩個詞語之間的前鏈接概率;
根據所述后鏈接概率對照表,確定所述M個詞語中每兩個詞語之間的后鏈接概率。
3.根據權利要求1所述的方法,其特征在于,所述將切分后得到的K個語塊亂序輸出,包括:
將切分得到的K個語塊按照順序設置對應的序號;
將K個語塊進行隨機排列,得到種排列方式;
對于每種排列方式,分別計算任兩個相鄰語塊的序號差值,確定每個序號差值的絕對值減1的數值,得到K-1個數值,計算所述K-1個數值的和值作為亂序程度分數;
確定種排列方式的亂序程度分數的最大值,按照所述最大值對應的排列方式對所述K個語塊進行排列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京語言大學,未經北京語言大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110559261.7/1.html,轉載請聲明來源鉆瓜專利網。





