[發明專利]一種近似題推送方法及系統有效
| 申請號: | 201611021239.2 | 申請日: | 2016-11-16 |
| 公開(公告)號: | CN106651696B | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 劉德建;詹博悍;章亮;陳霖;吳擁民;陳宏展 | 申請(專利權)人: | 福建天泉教育科技有限公司 |
| 主分類號: | G06Q50/20 | 分類號: | G06Q50/20 |
| 代理公司: | 福州市博深專利事務所(普通合伙) 35214 | 代理人: | 張明 |
| 地址: | 350212 福建省福州市長樂*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 近似 推送 方法 系統 | ||
1.一種近似題推送方法,其特征在于,包括:
S1、提取第一題目中的符號;
S2、根據所述的符號進行歸類,得到與所述第一題目相應的分類;
S3、計算所述第一題目與所述分類中各題目的相似度;
S4、根據所述相似度形成近似題集合;
S5、推送所述近似題集合;
所述S2具體為:
根據預設的轉義字符轉換所述符號,得到第二題目;
提取所述第二題目的特征,得到第一向量;
根據預設的知識點分類模型,得到與所述第一向量相應的分類;
提取所述第二題目的特征,得到第一向量,具體為:
解析所述第二題目,得到中文字符棧和非中文字符棧;
使用切詞算法對所述中文字符棧中的字符進行切詞處理,并使用預設的正則表達式匹配所述非中文字符棧中存儲的公式,得到第三題目;
從所述第三題目中刪除停止詞,得到第四題目;
提取所述第四題目的特征,得到第一向量;
從所述第三題目中刪除停止詞,得到第四題目,具體為:
使用TF-IDF算法計算所述第三題目中各個詞的權重;
將所述第三題目中的詞按其權重從大到小排序,形成第一隊列;
從所述第三題目中刪除與所述第一隊列后預設個數元素相應的詞,得到第四題目;
所述提取所述第四題目的特征,得到第一向量包括:
根據所述第四題目構建詞頻向量;所述詞頻向量中元素的個數為預設訓練數據集中不同詞的數量,所述詞頻向量中元素的值為與所述元素相應的詞在所述第四題目中出現的次數;
根據預設的維度建立語義特征抽取模型;
根據所述語義特征抽取模型構建與所述第四題目相應的語義向量;
根據預設的知識點分類模型,得到與所述詞頻向量和所述語義向量相應的分類;
根據預設的知識點分類模型,得到與所述詞頻向量和所述語義向量相應的分類,具體為:
根據基于詞頻的知識點分類模型,得到與所述詞頻向量相應的第一知識點集合;
根據基于語義的知識點分類模型,得到與所述語義向量相應的第二知識點集合;
根據所述第一知識點集合和所述第二知識點集合,得到第三知識點集合;
根據所述第三知識點集合得到與所述詞頻向量和所述語義向量相應的分類;
根據所述第一知識點集合和所述第二知識點集合,得到第三知識點集合,具體為:
獲取所述第一知識點集合和所述第二知識點集合中相同的知識點;
獲取所述相同的知識點根據基于詞頻的知識點分類模型得到的第一權重值;
獲取所述相同的知識點根據基于語義的知識點分類模型得到的第二權重值;
根據所述第一權重值和所述第二權重值,形成與所述相同的知識點相應的權重值集合;
根據所述權重值集合排序所述相同的知識點,獲取與預設知識點數相應的知識點,形成第三知識點集合。
2.根據權利要求1所述的近似題推送方法,其特征在于,所述S3具體為:
計算所述第一題目與所述分類中各題目的余弦距離;
根據所述余弦距離得到所述第一題目與所述分類中各題目的相似度。
3.根據權利要求1所述的近似題推送方法,其特征在于,所述S4具體為:
將所述分類中各題目按所述相似度排序,形成第二隊列;
從所述第二隊列中獲取與預設推薦數相應的題目,形成近似題集合。
4.一種近似題推送系統,其特征在于,包括:
提取模塊,用于提取第一題目中的符號;
歸類模塊,用于根據所述的符號進行歸類,得到與所述第一題目相應的分類;
計算模塊,用于計算所述第一題目與所述分類中各題目的相似度;
獲取模塊,用于根據所述相似度形成近似題集合;
推送模塊,用于推送所述近似題集合;
所述根據所述的符號進行歸類,得到與所述第一題目相應的分類具體為:
根據預設的轉義字符轉換所述符號,得到第二題目;
提取所述第二題目的特征,得到第一向量;
根據預設的知識點分類模型,得到與所述第一向量相應的分類;
提取所述第二題目的特征,得到第一向量,具體為:
解析所述第二題目,得到中文字符棧和非中文字符棧;
使用切詞算法對所述中文字符棧中的字符進行切詞處理,并使用預設的正則表達式匹配所述非中文字符棧中存儲的公式,得到第三題目;
從所述第三題目中刪除停止詞,得到第四題目;
提取所述第四題目的特征,得到第一向量;
從所述第三題目中刪除停止詞,得到第四題目,具體為:
使用TF-IDF算法計算所述第三題目中各個詞的權重;
將所述第三題目中的詞按其權重從大到小排序,形成第一隊列;
從所述第三題目中刪除與所述第一隊列后預設個數元素相應的詞,得到第四題目;
所述提取所述第四題目的特征,得到第一向量包括:
根據所述第四題目構建詞頻向量;所述詞頻向量中元素的個數為預設訓練數據集中不同詞的數量,所述詞頻向量中元素的值為與所述元素相應的詞在所述第四題目中出現的次數;
根據預設的維度建立語義特征抽取模型;
根據所述語義特征抽取模型構建與所述第四題目相應的語義向量;
根據預設的知識點分類模型,得到與所述詞頻向量和所述語義向量相應的分類;
根據預設的知識點分類模型,得到與所述詞頻向量和所述語義向量相應的分類,具體為:
根據基于詞頻的知識點分類模型,得到與所述詞頻向量相應的第一知識點集合;
根據基于語義的知識點分類模型,得到與所述語義向量相應的第二知識點集合;
根據所述第一知識點集合和所述第二知識點集合,得到第三知識點集合;
根據所述第三知識點集合得到與所述詞頻向量和所述語義向量相應的分類;
根據所述第一知識點集合和所述第二知識點集合,得到第三知識點集合,具體為:
獲取所述第一知識點集合和所述第二知識點集合中相同的知識點;
獲取所述相同的知識點根據基于詞頻的知識點分類模型得到的第一權重值;
獲取所述相同的知識點根據基于語義的知識點分類模型得到的第二權重值;
根據所述第一權重值和所述第二權重值,形成與所述相同的知識點相應的權重值集合;
根據所述權重值集合排序所述相同的知識點,獲取與預設知識點數相應的知識點,形成第三知識點集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建天泉教育科技有限公司,未經福建天泉教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611021239.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種出國留學咨詢平臺在線咨詢方法
- 下一篇:烤盤(帶耳魚紋6杯)





