[發明專利]一種語塊重組題型的自動命題的方法及裝置有效
| 申請號: | 202110559261.7 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113361238B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 殷曉君 | 申請(專利權)人: | 北京語言大學 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F40/253;G06Q50/20 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 重組 題型 自動 命題 方法 裝置 | ||
本發明涉及語言教學技術領域,特別是指一種語塊重組題型的自動命題的方法及裝置,方法包括:獲取待切分語句以及切分塊數K;通過預設的分詞算法對待切分語句進行分詞,得到待切分語句對應的M個詞語;分別計算每兩個詞語之間的前鏈接概率以及后鏈接概率,計算每個切分位對應的切分合理性得分;將M?1個切分位分別對應的切分合理性得分進行降序排列,選取前N個切分合理性得分對應的切分位,其中,N大于K?1;在N個切分合理性得分對應的切分位中選取K?1個切分位作為最終切分位組合;根據最終切分位組合,對待切分語句進行切分,并將切分后得到的K個語塊按亂序程度分取最高得分輸出。采用本發明,可以高效率地生成難度可控的、合理的題目。
技術領域
本發明涉及語言教學技術領域,特別是指一種語塊重組題型的自動命題的方法及裝置。
背景技術
當前在對外漢語教學中廣泛使用語言教學語塊重組題型的題目,如HSK考試。這種題型的題目通常是將原本完整、正確的一句話切分、打亂后生成的語塊,由考生通過這多個亂序的語塊組合成完整、語法正確的一句話語。目前,這種題型的出題完全依賴于教師的主觀判斷,效率低下,且缺乏科學性。
發明內容
本發明實施例提供了一種語塊重組題型的自動命題的方法及裝置。所述技術方案如下:
一方面,提供了一種語塊重組題型的自動命題的方法,該方法應用于電子設備,該方法包括:
獲取待切分語句以及切分塊數K;
通過預設的分詞算法對所述待切分語句進行分詞,得到所述待切分語句對應的M個詞語,所述M個詞語對應M-1個切分位,所述M-1大于所述K-1;
分別計算所述M個詞語中每兩個詞語之間的前鏈接概率以及后鏈接概率,計算所述M-1個切分位中每個切分位對應的切分合理性得分;
將所述M-1個切分位分別對應的切分合理性得分進行降序排列,選取前N個切分合理性得分對應的切分位,其中,所述N大于所述K-1;
在所述N個切分合理性得分對應的切分位中選取K-1個切分位作為最終切分位組合;
根據所述最終切分位組合,對所述待切分語句進行切分,并將切分后得到的K個語塊亂序輸出。
可選地,所述分別計算所述M個詞語中每兩個詞語之間的前鏈接概率以及后鏈接概率,包括:
獲取考試語言能力相關的大數據;
基于所述大數據,統計兩個詞語之間的前鏈接概率PLeft(W_j|W_i)以及后鏈接概率PRight(W_j|W_i),得到詞語之間的前鏈接概率對照表以及后鏈接概率對照表;
根據所述前鏈接概率對照表,確定所述M個詞語中每兩個詞語之間的前鏈接概率;
根據所述后鏈接概率對照表,確定所述M個詞語中每兩個詞語之間的后鏈接概率。
可選地,所述計算所述M-1個切分位中每個切分位對應的切分合理性得分,包括:
對于所述M-1個切分位中每個切分位,基于切分位對應的兩個詞語的前鏈接概率以及后鏈接概率,通過下述公式(1),確定切分位對應的切分合理性得分:
slot_split_score=log(1-PLeft)+log(1-PRight)……(1)
其中,slot_split_score表示切分位對應的切分合理性得分,PLeft表示切分位對應的兩個詞語之間的前鏈接概率,PRight表示切分位對應的兩個詞語之間的后鏈接概率。
可選地,所述在所述N個切分合理性得分對應的切分位中選取K-1個切分位作為最終切分位組合,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京語言大學,未經北京語言大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110559261.7/2.html,轉載請聲明來源鉆瓜專利網。





