[發明專利]篇章要點檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202010776952.8 | 申請日: | 2020-08-05 |
| 公開(公告)號: | CN111881694A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 李榮真;胡陽;付瑞吉;王士進;胡國平;文皓 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/194;G06F16/335 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 付麗 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 篇章 要點 檢測 方法 裝置 設備 存儲 介質 | ||
1.一種篇章要點檢測方法,其特征在于,包括:
獲取與待測篇章對應的題干的語義表示,以及所述待測篇章中每個文本單元的語義表示;
基于所述題干的語義表示,在所述題干對應的答題庫中選取滿足所述題干規定的答題要點的范文;
獲取所述范文的語義表示,并基于所述待測篇章中每個文本單元與所述范文的語義表示間的相似度,確定所述待測篇章中屬于篇章要點的文本單元。
2.根據權利要求1所述的方法,其特征在于,所述獲取與待測篇章對應的題干的語義表示,包括:
確定所述題干中每個句子的句子特征向量;
對所述題干中各句子間的句子特征向量做注意力操作,得到每個句子的注意力得分;
基于所述題干中每個句子的句子特征向量及其注意力得分,確定所述題干的上下文表示向量,作為題干的語義表示。
3.根據權利要求2所述的方法,其特征在于,所述確定所述題干中每個句子的句子特征向量,包括:
對所述題干中每個句子進行分詞,得到每個句子的分詞結果;
確定每個句子中各分詞的詞嵌入向量,并基于各分詞的詞嵌入向量確定對應句子的句子特征向量。
4.根據權利要求1所述的方法,其特征在于,所述基于所述題干的語義表示,在所述題干對應的答題庫中選取滿足所述題干規定的答題要點的范文,包括:
對于所述答題庫中每一份答題篇章,確定所述答題篇章中每個句子的句子特征向量;
基于所述答題篇章中每個句子的句子特征向量,以及所述題干的語義表示,確定每個句子與所述題干規定的答題要點的關聯程度;
選取所述答題篇章中關聯程度滿足設定關聯程度條件的目標句子,由目標句子組成所述答題篇章對應的要點句集合;
基于答題庫中每一答題篇章對應要點句集合的大小及設定范文選取策略,選取目標答題篇章對應的要點句集合組成范文。
5.根據權利要求4所述的方法,其特征在于,所述基于所述答題篇章中每個句子的句子特征向量,以及所述題干的語義表示,確定每個句子與所述題干規定的答題要點的關聯程度,包括:
將所述題干的語義表示分別與所述答題篇章中每個句子的句子特征向量做注意力操作,得到答題篇章中每個句子相對于題干的注意力得分,作為句子與題干規定的答題要點的關聯程度。
6.根據權利要求5所述的方法,其特征在于,確定每個句子與所述題干規定的答題要點的關聯程度的過程,還包括:
對所述答題篇章中各句子間的句子特征向量做注意力操作,得到每個句子的篇章內注意力得分;
將所述答題篇章中每個句子的篇章內注意力得分與相對于題干的注意力得分相加,得到每個句子的總注意力得分,作為句子與題干規定的答題要點的關聯程度。
7.根據權利要求4所述的方法,其特征在于,所述獲取所述范文的語義表示,包括:
基于所述范文中每一目標句子的句子特征向量及其與所述題干規定的答題要點的關聯程度,確定所述范文的上下文表示向量,作為范文的語義表示。
8.根據權利要求1所述的方法,其特征在于,所述范文為多個;
所述基于所述待測篇章中每個文本單元與所述范文的語義表示間的相似度,確定所述待測篇章中屬于篇章要點的文本單元,包括:
針對每個文本單元,判斷其與各范文的語義表示間的相似度中,超過設定相似度閾值的個數;
基于超過設定相似度閾值的個數,以及所述范文的個數,按照設定投票策略,確定所述文本單元是否屬于篇章要點。
9.根據權利要求8所述的方法,其特征在于,還包括:
對于確定屬于篇章要點的文本單元,基于該文本單元與各范文的語義表示間的相似度,確定該文本單元屬于篇章要點的置信度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010776952.8/1.html,轉載請聲明來源鉆瓜專利網。





