[發(fā)明專利]篇章要點檢測方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010776952.8 | 申請日: | 2020-08-05 |
| 公開(公告)號: | CN111881694A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計)人: | 李榮真;胡陽;付瑞吉;王士進;胡國平;文皓 | 申請(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/194;G06F16/335 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 付麗 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 篇章 要點 檢測 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種篇章要點檢測方法、裝置、設(shè)備及存儲介質(zhì),本申請在對待測篇章進行要點檢測時,考慮了待測篇章對應(yīng)的題干信息以及題干對應(yīng)的答題庫,其中題干明確了篇章應(yīng)該表達的要點,而答題庫可以提供豐富的輔助信息,基于此,本申請獲取題干的語義表示以及待測篇章中每個文本單元的語義表示,進而基于題干的語義表示,在答題庫中選取滿足題干規(guī)定的答題要點的范文,獲取范文的語義表示,并基于待測篇章中每個文本單元與范文的語義表示間的相似度,確定屬于篇章要點的文本單元。本申請既考慮了待測篇章自身的信息,進一步考慮了題干信息,基于題干篩選出范文,參考范文確定屬于篇章要點的文本單元,使得要點檢測結(jié)果更加準確。
技術(shù)領(lǐng)域
本申請涉及自然語言處理技術(shù)領(lǐng)域,更具體的說,是涉及一種篇章要點檢測方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
篇章要點表示篇章的主要內(nèi)容、中心思想,是當(dāng)前篇章語言學(xué)和話語分析研究的重點和熱點,有著廣泛的應(yīng)用,例如,可以用于問答、聊天機器人、漢英作文評價等領(lǐng)域。
隨著人工智能技術(shù)的發(fā)展和成熟,在傳統(tǒng)的教育領(lǐng)域,也逐漸開展新一代的教育信息化升級探索,國內(nèi)現(xiàn)有基礎(chǔ)教育階段,學(xué)生學(xué)習(xí)狀況的主要考察形式仍然是各種類型的考試。在此狀況下,教師背負著很大的批改工作的壓力,特別是漢英作文的批改,占用老師大量的時間和精力。因此利用計算機輔助完成評價,以減少人工評閱工作量,提升評分的準確性和客觀性,對教學(xué)過程意義重大。篇章要點檢測,可以幫助老師更加快速、準確的評價一篇作文,同時還可以用于作文質(zhì)檢,例如:沒有符合題意的要點,則很可能是離題作文。由此可見,現(xiàn)有技術(shù)亟需一種能夠準確檢測篇章要點的方案。
發(fā)明內(nèi)容
鑒于上述問題,提出了本申請以便提供一種篇章要點檢測方法、裝置、設(shè)備及存儲介質(zhì),以實現(xiàn)準確檢測篇章要點的目的。具體方案如下:
一種篇章要點檢測方法,包括:
獲取與待測篇章對應(yīng)的題干的語義表示,以及所述待測篇章中每個文本單元的語義表示;
基于所述題干的語義表示,在所述題干對應(yīng)的答題庫中選取滿足所述題干規(guī)定的答題要點的范文;
獲取所述范文的語義表示,并基于所述待測篇章中每個文本單元與所述范文的語義表示間的相似度,確定所述待測篇章中屬于篇章要點的文本單元。
優(yōu)選地,所述獲取與待測篇章對應(yīng)的題干的語義表示,包括:
確定所述題干中每個句子的句子特征向量;
對所述題干中各句子間的句子特征向量做注意力操作,得到每個句子的注意力得分;
基于所述題干中每個句子的句子特征向量及其注意力得分,確定所述題干的上下文表示向量,作為題干的語義表示。
優(yōu)選地,所述確定所述題干中每個句子的句子特征向量,包括:
對所述題干中每個句子進行分詞,得到每個句子的分詞結(jié)果;
確定每個句子中各分詞的詞嵌入向量,并基于各分詞的詞嵌入向量確定對應(yīng)句子的句子特征向量。
優(yōu)選地,所述基于所述題干的語義表示,在所述題干對應(yīng)的答題庫中選取滿足所述題干規(guī)定的答題要點的范文,包括:
對于所述答題庫中每一份答題篇章,確定所述答題篇章中每個句子的句子特征向量;
基于所述答題篇章中每個句子的句子特征向量,以及所述題干的語義表示,確定每個句子與所述題干規(guī)定的答題要點的關(guān)聯(lián)程度;
選取所述答題篇章中關(guān)聯(lián)程度滿足設(shè)定關(guān)聯(lián)程度條件的目標句子,由目標句子組成所述答題篇章對應(yīng)的要點句集合;
基于答題庫中每一答題篇章對應(yīng)要點句集合的大小及設(shè)定范文選取策略,選取目標答題篇章對應(yīng)的要點句集合組成范文。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010776952.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





