[發明專利]一種要點題自動評價方法及裝置有效
| 申請號: | 201710050484.4 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN106897384B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 沙晶;盛志超;陳志剛;魏思;胡國平;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06Q50/20 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 230088 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 要點 自動 評價 方法 裝置 | ||
1.一種要點題自動評價方法,其特征在于,所述方法包括:
獲取待評價的答題數據;
將所述答題數據向量化;
對向量化后的所述答題數據進行聚類,將聚類結果作為初步答題要點;
根據所述初步答題要點把所述答題數據分割為一個個分析單元,其中每個所述分析單元最多只涉及單個所述初步答題要點;
對分割為一個個分析單元的所述答題數據重新進行聚類,將新的聚類結果作為精確答題要點;
將所述精確答題要點輸入預先構建的評價模型,以得到所述答題數據的評價結果;
其中,根據所述初步答題要點把所述答題數據分割為一個個分析單元,包括:
對于所述答題數據中的每個基本單元,進行如下處理:
將當前基本單元中每個分詞點作為潛在分割點,計算每個潛在分割點左右兩側的內容分別與每個初步答題要點的相似度;
將值最大的相似度所對應的潛在分割點作為預備分割點;
若所述預備分割點位于當前基本單元的開頭或結尾,則確定無法分割;
若所述預備分割點位于當前基本單元內部,則將所述預備分割點作為真正分割點將當前基本單元分割為左右兩部分,并將左右兩部分各作為一個新的基本單元繼續進行分割,直至無法分割;
將無法分割的每個基本單元作為一個分析單元。
2.根據權利要求1所述的方法,其特征在于,將所述答題數據向量化,包括:
對所述答題數據分詞,并獲取每個詞的詞向量;
根據所述詞向量獲取所述答題數據中每個基本單元對應的向量,以完成所述答題數據的向量化。
3.根據權利要求1所述的方法,其特征在于,對向量化后的所述答題數據進行聚類,包括:
獲取預定義的聚類數目;
根據所述聚類數目對向量化后的所述答題數據進行第一次聚類;
對所述第一次聚類后得到的類別中心進行第二次聚類,以得到聚類結果。
4.根據權利要求3所述的方法,其特征在于,所述第一次聚類之后,所述第二次聚類之前,所述方法還包括:
獲取答題要點過濾表;
根據所述答題要點過濾表對所述第一次聚類后得到的類別中心進行過濾。
5.根據權利要求1所述的方法,其特征在于,將新的聚類結果作為精確答題要點之后,將所述精確答題要點輸入預先構建的評價模型之前,所述方法還包括:
循環執行以下過程一次或多次:
將所述精確答題要點重新作為初步答題要點,重新根據所述初步答題要點把所述答題數據分割為一個個分析單元,以及對分割為一個個分析單元的所述答題數據重新進行聚類以重新得到精確答題要點。
6.根據權利要求1所述的方法,其特征在于,獲取待評價的答題數據之前,所述方法還包括:
獲取定標數據,其中所述定標數據是通過上述步驟得到精確答題要點及人工給出評價結果的答題數據;
使用所述定標數據訓練得到所述評價模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710050484.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:家用電器系統和大數據平臺
- 下一篇:一種基于關聯矩陣的不確定數據連接合并算法





