[發(fā)明專利]一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110228195.5 | 申請(qǐng)日: | 2021-03-02 |
| 公開(公告)號(hào): | CN113033180A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 孫媛;陳安東 | 申請(qǐng)(專利權(quán))人: | 中央民族大學(xué) |
| 主分類號(hào): | G06F40/211 | 分類號(hào): | G06F40/211;G06F16/35;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 100081 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 小學(xué) 藏語 閱讀 問題 自動(dòng) 生成 服務(wù) 系統(tǒng) | ||
本發(fā)明涉及一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng),該系統(tǒng)包括藏語閱讀語料庫構(gòu)建模型和藏文閱讀文本問題生成模型;其中,藏語閱讀語料庫構(gòu)建模型,通過提取小學(xué)藏語文章特征數(shù)據(jù),并設(shè)計(jì)混合的多策略文本篩選模型,得到藏語閱讀語料庫;藏文閱讀文本問題生成模型包括編碼端和解碼端,其中,編碼端使用雙向RNN網(wǎng)絡(luò)和注意力機(jī)制;解碼端使用單向RNN網(wǎng)絡(luò)、注意力機(jī)制和復(fù)制機(jī)制。本發(fā)明通過設(shè)計(jì)的混合的多策略文本篩選模型,可以在大規(guī)模百科藏文文本中篩選出適合小學(xué)閱讀的藏語文文章。并且設(shè)計(jì)了端到端的自動(dòng)問題生成模型,它解決了小學(xué)藏語文閱讀教學(xué)材料體裁少、更新速度慢,人工出題量少等問題,從而推動(dòng)民族地區(qū)藏語教學(xué)的發(fā)展。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,特別涉及一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng)。
背景技術(shù)
目前自然語言處理(NLP)領(lǐng)域備受關(guān)注,自然語言處理的研究目標(biāo)是讓計(jì)算機(jī)學(xué)會(huì)理解和運(yùn)用人類的自然語言,是人工智能領(lǐng)域中的重要研究方向。近年來,自然語言處理方面的運(yùn)用層出不窮,如Facebook的SimpleQuestions、百度的文本生成工具逐漸應(yīng)用于教育領(lǐng)域,以改善教學(xué)為目的的閱讀理解問題生成、文章摘要生成等技術(shù)系統(tǒng)也開始涌現(xiàn),助力教學(xué)效率提升和學(xué)生的閱讀理解能力訓(xùn)練。
相比與漢語文教學(xué),藏語文的閱讀材料相對(duì)較少,更新速度較慢、選擇面也較窄,在出閱讀理解題目時(shí),采用的方式依然是通過老師人工出題,這導(dǎo)致藏語文閱讀教學(xué)材料的更新速度難以滿足學(xué)生的需求,限制了民族地區(qū)的藏語教學(xué)的發(fā)展。
發(fā)明內(nèi)容
本發(fā)明的目的在于,解決小學(xué)藏語文閱讀教學(xué)材料體裁少、更新速度慢、人工出題量小等問題,推動(dòng)民族地區(qū)藏語教學(xué)的發(fā)展。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng),該系統(tǒng)包括藏語閱讀語料庫構(gòu)建模型和藏文閱讀文本問題生成模型;其中,
藏語閱讀語料庫構(gòu)建模型,通過提取小學(xué)藏語文章特征數(shù)據(jù),并設(shè)計(jì)混合的多策略文本篩選模型,構(gòu)建藏語閱讀語料庫;
藏文閱讀文本問題生成模型,包括編碼端和解碼端,其中,編碼端使用雙向 RNN網(wǎng)絡(luò)和注意力機(jī)制;解碼端使用單向RNN網(wǎng)絡(luò)、注意力機(jī)制和復(fù)制機(jī)制。
本發(fā)明通過設(shè)計(jì)的混合的多策略文本篩選模型,可以在大規(guī)模百科藏文文本中篩選出適合小學(xué)閱讀的藏語文文章。并且設(shè)計(jì)了端到端的自動(dòng)問題生成模型,它解決了小學(xué)藏語文閱讀教學(xué)材料體裁少、更新速度慢,人工出題量少等問題,從而推動(dòng)民族地區(qū)藏語教學(xué)的發(fā)展。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng)結(jié)構(gòu)示意圖;
圖2為本發(fā)明實(shí)施例提供的另一種面向小學(xué)藏語文閱讀問題自動(dòng)生成的服務(wù)系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施例
本發(fā)明實(shí)施例設(shè)計(jì)了一種小學(xué)藏語閱讀理解問題自動(dòng)生成的智能服務(wù)系統(tǒng)。主要包括:
首先,以小學(xué)藏語文教材(1-6年級(jí))為訓(xùn)練語料,以文章長度、文章體裁、句子數(shù)量、平均句長、文章詞匯量、詞匯覆蓋度、冗余度為特征,設(shè)計(jì)了一種混合的多策略文本篩選模型,從大規(guī)模百科藏文文本中得到適合小學(xué)藏語文閱讀的材料。
然后,由中央民族大學(xué)國家語言資源監(jiān)測(cè)與研究中心帶領(lǐng)藏族學(xué)生完成藏語文本答案的標(biāo)注和對(duì)應(yīng)問題的生成,得到大規(guī)模閱讀文本的問題和答案,并設(shè)計(jì)了一種基于注意力機(jī)制和復(fù)制機(jī)制的端到端的藏文閱讀文本問題生成模型。編碼端使用雙向循環(huán)RNN網(wǎng)絡(luò),加入注意力機(jī)制來解決RNN網(wǎng)絡(luò)容易遺忘的問題。解碼端使用單向RNN網(wǎng)絡(luò),加入復(fù)制機(jī)制提高問題答案的可讀性。同時(shí),使用答案位置信息輸入到神經(jīng)網(wǎng)絡(luò)當(dāng)中,從而減少長文本輸入時(shí)的噪聲,提高問題的生成效果。
最后,使用Django框架搭建小學(xué)藏語閱讀理解問題自動(dòng)生成的智能服務(wù)系統(tǒng),實(shí)現(xiàn)藏語文閱讀文章的自動(dòng)篩選和出題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中央民族大學(xué),未經(jīng)中央民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110228195.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 電子閱讀器及其信息提示方法
- 一種閱讀頁面視覺效果個(gè)性化方法和裝置
- 一種基于眼動(dòng)跟蹤的最后閱讀位置顯示方法和系統(tǒng)
- 一種系統(tǒng)提高中小學(xué)生閱讀速度的訓(xùn)練方法及其終端
- 閱讀計(jì)劃確定方法、裝置、設(shè)備、服務(wù)器及存儲(chǔ)介質(zhì)
- 閱讀設(shè)備及檢測(cè)用戶閱讀行為和有效閱讀時(shí)長的方法
- 基于深度學(xué)習(xí)的英語閱讀分級(jí)和讀物推薦系統(tǒng)的實(shí)現(xiàn)方法
- 一種用于定制化推送消息的方法與設(shè)備
- 輔助閱讀的方法、裝置及電子設(shè)備
- 閱讀處理方法、裝置及系統(tǒng)





